본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 18. 11:20

언러닝(Unlearning)을 통한 공정한 경도 인지 장애 탐지

요약

경도 인지 장애(MCI) 탐지 모델이 인구통계학적 편향을 학습하는 문제를 해결하기 위해 언러닝(Unlearning) 기술을 적용한 멀티모달 프레임워크를 제안합니다. 그래디언트 리버설을 통해 성별 및 언어와 같은 불필요한 속성을 제거함으로써 하위 그룹 간 성능 격차를 줄이고 강건한 표현 학습을 달성했습니다.

핵심 포인트

  • 언러닝을 통해 인구통계학적 편향을 억제하는 멀티모달 프레임워크 제안
  • 음성, 텍스트, 이미지를 결합한 교차 모델 융합 방식 활용
  • TAUKADIAL 및 PREPARE 벤치마크에서 SOTA 성능 달성
  • 성별 및 언어에 따른 환자 하위 그룹 간 성능 격차 실질적 감소
  • 인구통계학적 언러닝이 강건한 표현 학습에 기여함을 입증

경도 인지 장애 (Mild Cognitive Impairment, MCI)는 기억력, 언어 또는 사고 능력의 눈에 띄는 저하를 특징으로 하는 의학적 상태입니다. 자발적 발화(spontaneous speech)로부터 MCI를 탐지하는 것은 확장 가능한 선별 검사로서 유망합니다. 그러나 학습된 모델들은 종종 레이블과 상관관계가 있는 인구통계학적 단서(demographic cues)를 악용하며, 이는 하위 그룹 간의 큰 성능 격차를 초래합니다. 우리는 (i) 양상(modalities: 음성, 텍스트 및 이미지) 간의 교차 모델 융합(cross-model fusion)과 (ii) 공유 임베딩(shared embedding)이 작업과 무관한 인구통계학적 속성을 인코딩하지 않도록 억제하는 그래디언트 리버설(gradient reversal)을 이용한 언러닝(unlearning)을 결합한 멀티모달 프레임워크를 제시합니다. 다국어 벤치마크인 TAUKADIAL 및 PREPARE에서 평가했을 때, 우리의 방법은 MCI 분류에서 최신(state-of-the-art) 다국어 및 멀티모달 베이스라인을 능가하는 동시에 환자 하위 그룹(성별 및 언어) 간의 성능 격차를 실질적으로 줄였습니다. 나아가 우리는 데이터셋 간의 전이(transfer)를 분석하여, 인구통계학적 언러닝(demographic unlearning)이 MCI 탐지를 위한 더 강건한 표현(robust representations)을 학습하는 데 도움이 된다는 것을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0