의료용 언어 모델(LMs)의 임상적 근거에 기반한 프라이버시 평가
요약
의료용 언어 모델이 환자의 민감한 정보를 암기하고 유출할 위험을 평가하는 새로운 프레임워크를 제안합니다. 연구 결과, 모델이 환자의 인적 사항과 민감한 진단명을 높은 확률로 복구할 수 있음을 확인했습니다.
핵심 포인트
- 임상적 근거 기반의 단계별 프라이버시 평가 프레임워크 제안
- 환자 메타데이터 및 민감 진단명(HIV, 낙태 등)의 높은 유출 위험 확인
- 축자적 암기가 정보 유출 위험을 과장할 수 있음을 지적
- 종단적 임상 데이터 학습 시의 프라이버시 위험성 강조
의료용 언어 모델(LMs)은 보호된 건강 정보(PHI)를 암기하고 재현할 수 있지만, 프라이버시 평가는 실제적인 위협 모델(threat models) 하에서의 정보 유출보다는 학습 텍스트의 복구에 초점을 맞추는 경우가 많습니다. 본 연구에서는 공개적으로 추론 가능한 인구통계학적 정보부터 유출된 진료 기록 파편에 이르기까지, 적대적 접근(adversarial access)의 단계별 축을 따라 유출을 평가하는 임상적 근거에 기반한 프레임워크를 소개합니다. 각 단계에서 우리는 환자 특정 텍스트의 축자적 암기(verbatim memorization)와 민감한 진단명에 대한 의미론적 유출(semantic leakage)을 측정합니다. 378,000개의 임상 기록으로 사전 학습된(pretrained) 언어 모델(LM)에 이 프레임워크를 적용한 결과, 일상적인 진료 메타데이터(즉, 이름, 생년월일, 의료진, 진료소, 방문 날짜)가 환자의 타임라인 전반에 걸쳐 높은 축자적 암기율을 유발하며, 민감한 진단명 복구(낙태의 경우 AUROC 0.91, HIV의 경우 0.81)를 일으킨다는 것을 발견했습니다. 동시에, 정확히 일치하는 암기(exact-match memorization)는 정보 유출을 과장할 수 있습니다. 암기된 토큰의 36%는 템플릿화된 문서 양식을 반영합니다. 우리의 연구는 종단적 임상 데이터(longitudinal clinical data)를 학습할 때의 위험성을 강조하며, 의료용 언어 모델(LMs)의 맥락적 프라이버시 평가를 위한 실질적인 프레임워크를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기