본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 18. 10:56

음성 기반 치매 평가에서의 채점 오류 완화 및 비언어적 하위 검사 보완

요약

음성 기반 치매 평가 시 발생하는 전사 오류와 비언어적 검사 누락 문제를 해결하기 위한 연구입니다. Whisper 임베딩과 전사 점수를 통합하여 전문가의 종합 등급을 정확하게 예측하는 모델을 제안합니다.

핵심 포인트

  • Whisper 임베딩과 전사 데이터를 통합하여 채점 오류 완화
  • 비언어적 하위 검사 없이도 전문가 등급 근사화 가능
  • 음성 유도 특징을 통한 인지 상태의 효율적 구별

인지 기능 저하의 조기 발견은 여러 인지 영역을 평가함으로써 주관성을 최소화하기 위해 신경심리학적 검사 (neuropsychological tests)에 의존합니다. 음성 기반 평가 (Speech-based evaluation)는 진단을 지원하고 접근성을 향상할 수 있지만, 전사 오류 (transcription errors)와 비언어적 하위 검사 (nonverbal subtests, 예: 운동 기술)의 누락은 정확도를 제한합니다. 전통적인 검사 점수를 넘어, 음성 유도 특징 (speech-derived features)은 인지 상태에 대한 추가적인 통찰을 제공할 수 있습니다. 본 연구는 언어적 및 운동적 하위 검사로 구성된 표준화된 치매 선별 검사인 독일의 "Syndrom-Kurz-Test"에 대한 음성 기반 평가를 조사합니다. 우리는 채점 오류를 줄이기 위해 각 언어적 하위 검사별로 전사 유도 점수 (transcript-derived scores)와 Whisper 임베딩 (embeddings)을 통합하는 모델을 학습시킵니다. 누락된 운동적 하위 검사를 보완하기 위해, 우리는 이러한 융합된 표현 (fused representations)을 활용하여 전문가의 종합 등급 (expert overall ratings)을 근사화합니다. 하위 검사를 생략했음에도 불구하고, 우리의 모델은 전문가 등급과 강력한 상관관계를 보이며 인지 상태 그룹 간을 효율적이고 정확하게 구별합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0