본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 07. 21:21

L2 의성어 처리의 인지 노력 평가: 눈 추적 데이터셋 개발 및 검증

요약

본 논문은 L2 학습자가 의성어를 처리할 때 발생하는 인지 노력을 측정하기 위해 눈 추적 데이터셋을 개발하고 검증했습니다. 이 데이터셋은 CEFR 레벨별 포르투갈어 모국어 화자에게서 수집된 눈 추적 지표를 포함하며, 언어 능력과 회귀 움직임 간의 관계를 보여주며 유효성을 입증합니다. 궁극적으로 이 자원은 인간의 비유적 이해 모델을 평가하고 대규모 언어 모델(LLM)이 인간적인 방식으로 정렬되는지를 측정하는 인지 기반 벤치마크로 활용될 수 있습니다.

핵심 포인트

  • L2 학습자의 의성어 처리 과정에서 발생하는 '인지 비용'을 눈 추적 데이터를 통해 측정할 수 있게 했습니다.
  • 데이터셋은 CEFR 레벨별 포르투갈어 모국어 화자에게서 수집되었으며, 언어 능력과 시각적 인지 행동(회귀 움직임) 간의 상관관계를 보여줍니다.
  • 이 데이터셋은 인간의 비유적 이해 모델링(MIA) 프로젝트에 통합되어 LLM을 평가하는 새로운 인지 기반 벤치마크 역할을 합니다.
  • 60Hz 샘플링 속도만으로도 고정점 및 회귀와 같은 거시적인 인지 사건을 포착하기에 충분함을 입증했습니다.

본 논문은 두 번째 언어 (L2) 학습자가 의성어를 어떻게 처리하는지 조사하기 위해 개발하고 검증한 눈 추적 (eye-tracking) 데이터셋을 제시합니다. 모국어 화자들은 비유적 의미를 직접적으로 검색하는 방식을 주로 사용하지만, L2 화자들은 종종 직관적인 접근법을 채택하여 측정 가능한 인지 비용을 발생시킵니다. 이 자원 (resource) 은 CEFR proficiency levels(A1-C2) 전반의 영어 모국어 (L1) 화자인 포르투갈어 화자에서 기록된 눈 추적 지표를 통해 이러한 비용을 포착합니다. 연구는 60 Hz 하드웨어 (Tobii Pro Spark) 를 사용하지만, 이 샘플링 속도는 읽기 동안 고정점 (fixations) 및 회귀 (regressions) 와 같은 거시적 인지 사건을 감지하기에 충분한 데이터 밀도를 제공함을 보여줍니다. 예비 분석은 언어 능력과 회귀 눈 움직임 사이의 강한 역상관 관계를 드러냄으로써 데이터셋을 검증합니다. 이 데이터셋은 인간과 인공지능 언어 처리에서의 의성성 모델링 (MIA: Modeling Idiomaticity in Human and Artificial Language Processing) 초기화 프로젝트에 통합되어, 인간의 처리 모델을 평가하고 대형 언어 모델이 인간적인 비유적 이해와 정렬되는지를 평가하는 인지 기반 벤치마크 역할을 합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0