arXiv논문2026. 05. 20. 11:56

의료 영상 분류의 공정성을 위한 뉴런 발생 분포 재배치 (Neuron Incidence Redistribution)

요약

의료 영상 분류 모델이 특정 인구통계학적 그룹에 대해 과잉 또는 과소 진단을 내리는 편향 문제를 해결하기 위한 새로운 정규화 방법인 NIR(Neuron Incidence Redistribution)을 제안합니다. NIR은 인구통계학적 레이블 없이도 마지막 전 층 뉴런의 활성화 분포를 재배치하여 질병 증거를 분산시킴으로써 그룹 간 성능 격차를 획기적으로 줄입니다.

핵심 포인트

특정 인구통계학적 그룹(남성, 고령층 등)과 질병 양성 신호가 특정 뉴런 채널에 공동 활성화되어 발생하는 편향 메커니즘 식별
인구통계학적 레이블 없이도 적용 가능한 경량화된 정규화 기법인 NIR 제안
HAM10000 데이터셋에서 연령 및 성별에 따른 TPR 격차를 대폭 감소시킴
Harvard OCT-RNFL 데이터셋에서 인종 및 연령에 대한 FPR 격차 개선 확인
질병 증거를 마지막 전 층 전체에 분산시키는 것이 의료 AI의 공정성 확보에 효과적임을 입증

의료 영상 분류 (Medical image classification)를 위한 딥러닝 (Deep learning) 모델은 연령, 성별, 인종과 같은 인구통계학적 속성에 따라 하위 그룹 간 성능 격차가 발생하기 쉽습니다. 우리는 이러한 격차의 근저에 있는 잠재적 표현 메커니즘 (Latent representational mechanism)을 식별했습니다. 전이 학습 (Transfer-learned) 모델에서, 양성 예측 (Positive predictions) 시 지배적인 마지막 전 층 활성화 채널 (Penultimate-layer activation channel)은 질병 양성 샘플과 특권적 인구통계학적 그룹 (남성, 고령 환자)에 의해 공동 활성화되어 과잉 진단 (Over-diagnosis)을 유발합니다. 반대로, 음성 예측 (Negative predictions) 시 지배적인 채널은 취약 계층 (여성, 젊은 환자)에 의해 공동 활성화되어 체계적인 과소 진단 (Under-diagnosis)을 유발합니다. 이를 해결하기 위해, 우리는 훈련 시 인구통계학적 레이블이 필요하지 않으면서 마지막 전 층 뉴런 (Penultimate-layer neurons) 전반에 걸친 예측 확률 가중 평균 활성화 (Predicted-probability-weighted mean activations)의 분산을 페널티로 부여하는 경량화된 정규화 (Regularization) 방법인 뉴런 발생 분포 재배치 (Neuron Incidence Redistribution, NIR)를 제안합니다. HAM10000 데이터셋에서 NIR을 적용했을 때, 연령 그룹 간 TPR 격차는 10.81%에서 0.93%로, 성별 간 격차는 12.04%에서 0.74%로 감소하였으며, AUC는 0.51포인트 미세하게 향상되었습니다. Harvard OCT-RNFL 데이터셋에서는 NIR이 인종에 대한 FPR 격차(15.68%에서 10.66%로)와 연령에 대한 FPR 격차(12.69%에서 1.80%로)를 줄였습니다. 이는 잠재적인 질병 증거 (Latent disease evidence)를 마지막 전 층 전체에 분산시키는 것이 의료 AI의 인구통계학적 공정성 (Demographic fairness)을 개선하기 위한 원칙적이고 효과적인 전략임을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

의료 영상 분류의 공정성을 위한 뉴런 발생 분포 재배치 (Neuron Incidence Redistribution)

요약

핵심 포인트

댓글