arXiv논문2026. 06. 17. 12:28

행간 읽기: 임상 인터뷰를 통한 전역적 치매 및 우울증 평가를 위한 대규모 언어 모델 (LLM) 활용

요약

독일어 사용자의 임상 인터뷰 데이터를 활용하여 치매와 우울증의 중증도를 예측하는 LLM 연구를 소개합니다. Mistral, DeepHermes, Qwen 모델을 통해 제로샷 예측 및 특징 추출 성능을 비교 분석했습니다.

핵심 포인트

LLM을 활용한 치매 및 우울증 감별 진단 가능성 입증
제로샷 설정에서 우울증 중증도 예측 효과 확인
특징 추출 방식을 통해 치매 평가 오류를 최대 35% 감소
일시 정지 정보가 포함된 전사본이 높은 성능을 보임

치매 (Dementia)와 우울증 (Depression)은 노인 인구에서 가장 흔한 신경정신 질환이며, 이들의 중첩되는 증상은 감별 진단에 큰 어려움을 줍니다. 본 연구에서는 154명의 독일어 사용자를 대상으로 표준화된 병력 청취 인터뷰 중에 수집된 음성 샘플로부터 치매 및 우울증의 중증도를 예측하기 위해 오픈 웨이트 (open-weights) 대규모 언어 모델 (LLMs)을 조사합니다. 우리는 기존의 전역적 퇴화 척도 (Global Deterioration Scale, GDS)와 정렬된 관찰자 기반 전역적 우울증 척도 (Global Depression Scale, GDS-D)를 도입하여, 정서적 증상과 인지적 증상의 병렬적인 전역적 단계 설정을 가능하게 합니다. 우리는 두 가지 설정에서 세 가지 LLM (Mistral 3.1, DeepHermes, Qwen3)을 비교합니다: (1) 제로샷 (zero-shot) 예측, 그리고 (2) 인간의 전사본 및 일시 정지 (pause) 정보가 풍부한 전사본을 사용한 서포트 벡터 회귀 (Support Vector Regression)용 LLM 기반 특징 추출 (feature extraction). 결과에 따르면, LLM은 제로샷 설정에서 우울증 중증도를 효과적으로 예측하며 (최고 MAE 0.60), 치매 평가는 구조화된 특징 추출을 통해 상당한 이득을 얻어 (최고 MAE 0.78), 제로샷 베이스라인 대비 오류를 최대 35%까지 줄였습니다. 일시 정지 정보가 풍부한 전사본은 인간의 전사본과 경쟁력 있는 성능을 달성하였으며, 이는 감별 신경정신학적 평가를 위한 완전 자동화된 스크리닝 파이프라인의 생존 가능성을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

행간 읽기: 임상 인터뷰를 통한 전역적 치매 및 우울증 평가를 위한 대규모 언어 모델 (LLM) 활용

요약

핵심 포인트

댓글