arXiv논문2026. 06. 18. 10:56

음성 기반 치매 평가에서의 채점 오류 완화 및 비언어적 하위 검사 보완

요약

음성 기반 치매 평가 시 발생하는 전사 오류와 비언어적 검사 누락 문제를 해결하기 위한 연구입니다. Whisper 임베딩과 전사 점수를 통합하여 전문가의 종합 등급을 정확하게 예측하는 모델을 제안합니다.

핵심 포인트

Whisper 임베딩과 전사 데이터를 통합하여 채점 오류 완화
비언어적 하위 검사 없이도 전문가 등급 근사화 가능
음성 유도 특징을 통한 인지 상태의 효율적 구별

인지 기능 저하의 조기 발견은 여러 인지 영역을 평가함으로써 주관성을 최소화하기 위해 신경심리학적 검사 (neuropsychological tests)에 의존합니다. 음성 기반 평가 (Speech-based evaluation)는 진단을 지원하고 접근성을 향상할 수 있지만, 전사 오류 (transcription errors)와 비언어적 하위 검사 (nonverbal subtests, 예: 운동 기술)의 누락은 정확도를 제한합니다. 전통적인 검사 점수를 넘어, 음성 유도 특징 (speech-derived features)은 인지 상태에 대한 추가적인 통찰을 제공할 수 있습니다. 본 연구는 언어적 및 운동적 하위 검사로 구성된 표준화된 치매 선별 검사인 독일의 "Syndrom-Kurz-Test"에 대한 음성 기반 평가를 조사합니다. 우리는 채점 오류를 줄이기 위해 각 언어적 하위 검사별로 전사 유도 점수 (transcript-derived scores)와 Whisper 임베딩 (embeddings)을 통합하는 모델을 학습시킵니다. 누락된 운동적 하위 검사를 보완하기 위해, 우리는 이러한 융합된 표현 (fused representations)을 활용하여 전문가의 종합 등급 (expert overall ratings)을 근사화합니다. 하위 검사를 생략했음에도 불구하고, 우리의 모델은 전문가 등급과 강력한 상관관계를 보이며 인지 상태 그룹 간을 효율적이고 정확하게 구별합니다.

AI 자동 생성 콘텐츠

원문 바로가기

음성 기반 치매 평가에서의 채점 오류 완화 및 비언어적 하위 검사 보완

요약

핵심 포인트

댓글