arXiv논문2026. 06. 24. 11:43

BEA 2026 Shared Task 1: L1 인지 어휘 난이도 예측을 위한 신경망 융합 및 풍부한 특징 모델링 (UOL@IDEM)

요약

BEA 2026 Shared Task 1을 위한 L1 인지 어휘 난이도 예측 시스템을 제안합니다. 다국어 문맥 표현과 다양한 엔지니어링 특징을 결합하여 스페인어, 독일어, 중국어에서 우수한 RMSE 성능을 달성했습니다.

핵심 포인트

다국어 문맥 표현과 빈도, 형태, 검색 증거 등 다양한 특징 결합
BGE-M3, multilingual E5, LaBSE 인코더가 가장 우수한 성능 기록
빈도(frequency)가 가장 안정적인 예측 변수로 확인됨
쉬운 항목에 대한 보정(calibration) 능력 개선 필요성 식별

본 논문은 L1 인지 어휘 난이도 예측(L1-aware vocabulary difficulty prediction)에 관한 BEA 2026 shared task에 대한 UOL@IDEM의 closed-track 제출물을 설명합니다. 우리는 이 과제를 회귀(regression) 문제로 모델링하였으며, 스페인어, 독일어, 그리고 중국어ootnote{아래에서는 간결함을 위해 extit{Chinese}라고 사용합니다.}를 위한 별도의 시스템을 학습시켰습니다. 우리의 시스템은 다국어 문맥 표현(multilingual contextual representations)과 빈도(frequency), 표면 형태(surface form), 검색 증거(retrieval evidence), 의미적 정렬(semantic alignment), 동계어 유사도(cognate similarity), 그리고 마스크 언어 모델 예측 가능성(masked-language-model predictability)을 포착하는 엔지니어링된 특징(engineered features)을 결합합니다. 개발 결과에 따르면, BGE-M3, multilingual E5, LaBSE와 같은 문장 임베딩 인코더(sentence-embedding encoders)가 가장 우수한 성능을 보이며 공식 closed-track 베이스라인(baselines) 대비 일관된 성능 향상을 보여주었습니다. 공식 제출 결과, 스페인어, 독일어, 중국어에 대해 각각 1.132, 1.037, 0.891의 RMSE 점수를 달성했습니다. 특징 분석(Feature analysis) 결과 빈도(frequency)가 가장 안정적인 예측 변수(predictor)로 식별되었으며, 문맥적 예측 가능성(contextual predictability), 형태 유사성(form similarity), 검색(retrieval), 그리고 의미적 특징(semantic features)은 상호 보완적인 L1 민감 신호(L1-sensitive signals)를 제공합니다. 오차 분석(Error analysis) 결과, 강력한 순위 성능(ranking performance)을 보였으나 가장 쉬운 항목들에 대해서는 보정(calibration) 능력이 약하여 종종 과다 예측(overpredicted)되는 경향이 나타났습니다. https://github.com/Nouran-Khallaf/UoL-IDEM-BEA2026-Vocabulary-Difficulty-Prediction 을 참조하십시오.

AI 자동 생성 콘텐츠

원문 바로가기

BEA 2026 Shared Task 1: L1 인지 어휘 난이도 예측을 위한 신경망 융합 및 풍부한 특징 모델링 (UOL@IDEM)

요약

핵심 포인트

댓글