잊혀진 단어들: 저자원 필리핀어 및 영어 대화 음성에서의 치매 탐지를 위한 NeoBERT 벤치마킹
요약
필리핀어-영어 코드 스위칭 환경에서 NeoBERT를 활용한 치매 탐지 성능을 벤치마킹한 연구입니다. 연구 결과, 모델 아키텍처보다 이중 언어 미세 조정(bilingual fine-tuning)을 통한 언어적 커버리지 확보가 다국어 임상 NLP 성능에 결정적임을 입증했습니다.
핵심 포인트
- 필리핀어-영어 병렬 데이터셋 4,000개 구축
- NeoBERT 및 다양한 트랜스포머 모델 성능 비교
- 단일 언어 학습 시 언어 간 성능 전이 한계 확인
- 이중 언어 미세 조정 시 Macro-F1 0.97 수준 달성
- 임상 NLP에서 언어적 커버리지의 중요성 강조
자발적 발화(spontaneous speech)를 통한 치매 탐지는 인지 스크리닝을 위한 확장 가능한 접근 방식을 제공하지만, 자연어 처리 (NLP) 시스템은 여전히 주로 영어 중심적입니다. 이러한 한계는 필리핀어-영어 코드 스위칭 (code-switching)이 만연해 있고, NLP 기반의 치매 탐지를 다룬 선행 연구가 없는 필리핀에서 특히 심각합니다. 본 연구에서는 필리핀어 음성에서의 트랜스포머 (transformer) 기반 치매 탐지에 대한 최초의 체계적인 평가와 임상 NLP 환경에서의 NeoBERT에 대한 최초의 평가를 제시합니다. 언어적 효과와 도메인 효과를 분리하기 위해, 우리는 인지 저하의 담화 수준 마커 (discourse-level markers)를 보존하기 위해 수동으로 제작된 필리핀어 번역을 포함하여, DementiaBank에서 유도된 4,000개의 병렬 이중 언어 데이터셋을 구축했습니다. 우리는 단일 언어 (monolingual), 제로샷 교차 언어 (zero-shot cross-lingual), 그리고 이중 언어 미세 조정 (bilingual fine-tuning) 설정 하에서 TF-IDF + LogReg, BERT, NeoBERT, XLM-R, RoBERTa-Tagalog의 다섯 가지 모델 제품군을 평가합니다. 연구 결과, 도메인 내 성능은 언어 간에 전이되지 않으며, 영어로 학습된 BERT는 필리핀어에서 Macro-F1 = 0.455로 하락하고, 아키텍처 (architecture)의 현대화만으로는 견고성 (robustness)을 개선할 수 없음을 발견했습니다. 그러나 이중 언어 미세 조정은 모든 트랜스포머 모델에서 교차 언어 성능 저하를 제거하여 Macro-F1 = 0.969-0.973으로 수렴하게 합니다. 이러한 결과는 다국어 임상 NLP 성능이 모델의 규모나 아키텍처보다는 학습 과정에서의 언어적 커버리지 (linguistic coverage)에 의해 주로 결정된다는 것을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기