본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 28. 17:25

프롬프트 유도 (Prompt Induction) 를 통한 우울증 증상 증거 학습

요약

본 논문은 온라인 포럼 및 소셜 미디어와 같은 비임상 환경의 사용자 생성 텍스트에서 우울증 증거를 자동으로 식별하는 방법을 제안합니다. 기존 LLM 접근법이 일관된 관련성 기준을 적용하는 데 어려움을 겪는 문제를 해결하기 위해, 연구진은 '증상 유도(Symptom Induction, SI)'라는 새로운 프레임워크를 도입했습니다. 이 방법은 각 증상이 어떤 내용으로 간주되는지 명시하는 해석 가능한 지침을 사용하여 분류를 조건화함으로써, 기존 모델보다 높은 성능과 일반화 능력을 입증했습니다.

핵심 포인트

  • 우울증 증상 식별의 필요성: 온라인 텍스트에서 임상적 증거를 자동으로 추출하여 정신 건강 서비스 부담 완화 및 대규모 인구 적용 가능.
  • 기존 LLM의 한계점: 범용적인 LLM 접근법은 세분화되고 불균형한 증상 관련성 분류 작업에서 일관된 기준 적용에 어려움을 겪음.
  • 새로운 방법론 '증상 유도(SI)': 각 증상이 증거로 간주되는 내용을 명시하는 해석 가능한 지침을 사용하여 분류를 조건화함.
  • 성능 우수성 입증: SI는 BDI-Sen 데이터셋에서 네 가지 LLM 계열 및 8개 모델에 걸쳐 전반적으로 가장 높은 가중치 F1 점수를 달성했으며, 특히 희귀 증상에서 큰 개선을 보임.
  • 뛰어난 일반화 능력: 외부 데이터셋 평가를 통해 SI가 양극성 장애나 섭식 장애와 같이 공통된 증상을 공유하는 다른 질환에도 효과적으로 적용될 수 있음을 입증함.

우울증은 정신건강 서비스에 상당한 부담을 주며, 많은 사람들이 임상 환경 밖에서 고빈도 사용자 생성 텍스트 (예: 온라인 포럼 및 소셜 미디어) 를 통해 자신의 경험을 서술합니다. 따라서 이러한 텍스트 내에서 임상적 증상 증거를 자동으로 식별하는 것은 제한된 임상 능력을 보완하고 대규모 인구 집단으로 확장할 수 있습니다. 우리는 BDI-II 설문지의 21 가지 우울증 증상을 문장 수준의 분류를 통해 이 필요에 대응하며, 증상 관련성 (symptom relevance) 이 주석 처리된 데이터셋인 BDI-Sen 을 사용합니다. 이 작업은 세분화 (fine-grained) 가 되며 고도로 불균형 (highly imbalanced) 한데, 우리는 일반적인 대규모 언어 모델 (LLM) 접근법 (zero-shot, in-context learning, fine-tuning) 이 대부분의 증상에서 일관된 관련성 기준을 적용하는 데 어려움을 겪는다는 것을 발견했습니다. 우리는 각 증증이 증거로 간주되는 내용을 명시하는 짧은 해석 가능한 지침으로 레이블이 지정된 예시를 압축하고 이러한 지침을 사용하여 분류를 조건화 (condition classification) 하는 새로운 접근법인 증상 유도 (Symptom Induction, SI) 를 제안합니다. 네 가지 LLM 계열과 8 개의 모델에 걸쳐 SI 는 BDI-Sen 에서 전반적으로 가장 높은 가중치 F1 점수를 달성하며, 특히 빈도가 낮은 증상에서 큰 향상을 보입니다. 외부 데이터셋에 대한 교차 도메인 평가는 유도된 지침이 양극성 장애 (bipolar) 와 섭식 장애 (eating disorders) 와 같이 공통된 증상학을 공유하는 다른 질환에서도 일반화됨을 추가로 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0