본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 06. 18:11

EQUITRIAGE: LLM 기반 응급실 분류의 성차별에 대한 공정성 감사

요약

본 논문은 LLM 기반 응급실(ED) 분류 시스템의 공정성을 평가하기 위한 'EQUITRIAGE'라는 프레임워크를 제시합니다. 이 연구는 5개 모델을 사용하여 MIMIC-IV 데이터셋에서 성별에 따른 편향성(undertriage)을 감사했으며, 대부분의 모델이 임상적 증거와 유사하게 여전히 높은 플립률과 방향성 여성 불분류 경향을 보임을 확인했습니다. 또한, 인종/성별 정보 비공개 등의 개입 기법이 일부 편향성을 줄일 수 있지만, 공정성 속성이 서로 다르며 모델 의존적인 감사 과정이 필수적임을 강조합니다.

핵심 포인트

  • LLM 기반 응급실 분류 시스템은 여전히 성별에 따른 불평등(undertriage)을 보이며, 임상적 편향을 재현할 위험이 높습니다.
  • EQUITRIAGE 프레임워크는 그룹 평등, 카운터팩추얼 불변성 등 다양한 공정성 속성을 모델별로 감사하는 체계적인 방법을 제공합니다.
  • 단순한 정보 비공개(blinding)만으로는 모든 편향을 제거할 수 없으며, 연령이나 이름/성별 조합 같은 근본적인 특징이 편향의 원인일 수 있습니다.
  • LLM 기반 의료 AI를 임상에 배포하기 전에는 모델별 카운터팩추얼 감사(counterfactual auditing)가 필수적으로 선행되어야 합니다.

응급실 (Emergency Department) 분류는 환자의 치료 우선순위를 결정하는 급성도 점수 (acuity score) 를 할당하며, 임상적 증거는 인간 평가에서 지속된 성별 격차를 문서화하고 있습니다. 병원들이 LLM(대형 언어 모델) 을 분류 의사결정 지원으로 실험함에 따라, 이러한 모델이 알려진 편향을 재현하는지 완화하는지는 중요한 질문입니다.

우리는 4 가지 프롬프트 전략 (prompt strategies) 에서 18,714 개의 MIMIC-IV-ED 시나리오에 대해 374,275 번의 평가를 통해 5 개 모델 (Gemini-3-Flash, Nemotron-3-Super, DeepSeek-V3.1, Mistral-Small-3.2, GPT-4.1-Nano) 을 평가한 LLM 기반 ESI(응급실 상태 지수) 할당에 대한 공정성 감사인 EQUITRIAGE 를 제시합니다. 9,368 개의 원본 중 9,346 개는 성별이 반전된 카운터팩추얼 (counterfactual) 과 짝지어졌습니다.

5 개 모델 모두 사전 등록한 5% 임계치 (threshold) 보다 높은 플립률 (flip rates) 을 생성했습니다 (9.9% 에서 43.8%). 두 모델은 방향성 여성 불분류 (directional female undertriage) 를 보였습니다 (DeepSeek F/M 2.15:1, Gemini 1.34:1); 두 모델은 거의 평등에 가깝고, 한 모델은 높은 민감도 (sensitivity) 와 약한 남성 방향 비대칭성 (male-direction asymmetry) 을 보였습니다.

DeepSeek 의 방향성 편향은 MIMIC-IV 입원율과 관련된 낮은 결과 연결 교정 간격 (calibration gap, 0.013) 과 공존했습니다. 이는 Chouldechova 스타일의 그룹 내 교정 (within-group calibration) 과 쌍대 카운터팩추얼 불변성 (between-pair counterfactual invariance) 사이의 분리입니다.

인종/성별 정보 비공개 (demographic blinding) 는 Gemini 의 플립률을 0.5% 로 줄였습니다. 연령 보존 비공개 (age-preserving blind) 변형은 DeepSeek 에 잔류 F/M 1.25 를 남겼으며, 이는 연령이 잔류 채널임을 시사합니다.

시나리오 사고 (Chain-of-thought) 프롬프팅은 5 개 모델 모두의 정확도를 저하시켰습니다.

두 모델 아블레이션 (ablation) 은 동일한 방향성 표현형에 대해 반대되는 근본 기작을 보여줍니다: Gemini 에서는 신호가 이름 + 성별 반전 조합에서 나타나며, DeepSeek 에서는 성별 토큰만 그것을 운반합니다.

EQUITRIAGE 는 그룹 평등 (group parity), 카운터팩추얼 불변성, 성별 교정이 서로 다른 공정성 속성임을, 개입 효과는 모델 의존적임을, 그리고 임상 배포 전에 모델별 카운터팩추얼 감사 (auditing) 가 선행되어야 함을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0