arXiv논문2026. 06. 19. 11:06

보정(Calibration)이 취약한 병원을 위협할 때: 리스크 곡선 수축(Risk-Curve Shrinkage)을 통한 연합 정합적 리스크

요약

연합 학습 환경에서 정합적 리스크 제어(CRC)의 취약성을 분석하고, 리스크 곡선 수축(Shrinkage)을 통한 새로운 연합 CRC 프로토콜을 제안합니다. 기존 방식이 특정 기관의 커버리지 위반을 초래하는 문제를 해결하여, 예측 집합의 효율성을 유지하면서도 안정적인 리스크 보장을 제공합니다.

핵심 포인트

단순 통합 CRC 방식은 개별 기관의 커버리지 위반 위험이 높음
로컬 CRC 방식은 예측 집합을 과도하게 팽창시켜 임상 활용도가 낮음
수축 기반 프로토콜을 통해 커버리지와 효율성 간의 균형 달성
유한 표본 보정 항(finite-sample correction term)의 필수성 입증

정합적 리스크 제어 (Conformal Risk Control, CRC)는 홀드아웃 데이터 (held-out data)에서 예측 집합 임계값 (prediction-set threshold)을 보정함으로써 세분화 품질 (segmentation quality)에 대한 분포 무관 보장 (distribution-free guarantees)을 제공합니다. 연합 배포 (federated deployments) 환경에서 표준적인 접근 방식은 여러 사이트의 보정 점수 (calibration scores)를 하나의 임계값으로 통합합니다. 우리는 실제 다기관 뇌종양 데이터 (FeTS-2022, 1,251명, 20개 기관)를 통해 이러한 단순 통합 CRC 방식이 평균적인 병원은 보호하지만, 개별 기관의 40%에서는 커버리지 (coverage)를 위반하며, 최악의 사이트는 목표 위음성률 (false-negative rate)을 7.8%포인트 초과한다는 점을 최초로 정량화하여 보여줍니다. 단순한 대안인 사이트별 로컬 CRC (per-site local CRC)는 커버리지를 대부분 회복하지만, 예측 집합 (prediction sets)을 83배나 팽창시켜 임상적으로 무용지물로 만듭니다. 우리는 수축 기반의 연합 CRC 프로토콜 (shrinkage-based federated CRC protocol)을 제안합니다. 각 사이트는 자신의 경험적 리스크 곡선 (empirical risk curve, G 스칼라)만을 서버로 전송하며, 서버는 사이트별로 수축 정규화된 임계값 (shrinkage-regularized threshold)을 계산합니다. 단일 하이퍼파라미터 $n_0$는 최악의 경우 커버리지와 예측 집합 효율성 (prediction-set efficiency) 사이를 매끄럽게 조절합니다. Leave-one-site-out 민감도 분석을 통해 $n_0=19$를 식별하였으며, 이는 2.0배의 확장 (stretch) 하에서 20개 중 2.7개의 위반을 달성합니다. 우리는 더 나아가 커버리지 예산 (coverage budgets)에 대한 직접적인 라그랑주 최적화 (Lagrangian optimization)가 실패하여 취약한 병원에 리스크를 집중시킨다는 점과, 유한 표본 보정 항 (finite-sample correction term)이 필수적임을 보여줍니다. 이 항을 제거하면 위반 횟수가 3배로 증가합니다. 한계 CRC 보장 (marginal CRC guarantee)은 명시된 사이트 혼합 가정 (site-mixture assumption) 하에 구조적으로 보존됩니다. 사이트별 커버리지는 3개의 시드 (seeds)를 사용하여 4개의 목표치에 대해 검증되었습니다. 환자 수준의 이미지, 마스크 또는 볼륨당 점수는 어떤 사이트도 벗어나지 않습니다.

AI 자동 생성 콘텐츠

원문 바로가기

보정(Calibration)이 취약한 병원을 위협할 때: 리스크 곡선 수축(Risk-Curve Shrinkage)을 통한 연합 정합적 리스크

요약

핵심 포인트

댓글