arXiv논문2026. 05. 20. 11:56

사후적 위임 학습 (Post-Hoc Learning to Defer)을 위한 밀도비 손실 (Density-Ratio Losses)

요약

본 논문은 사후적 위임 학습(Learning to Defer, L2D)을 이상적인 데이터 분포 간의 밀도비(density-ratio) 관점에서 재정의하고 연구합니다. 밀도비 추정을 클래스 확률 추정(CPE)으로 변환하여 재학습 없이도 위임률을 조정할 수 있는 DR CPE 손실 함수를 제안하며, 실험을 통해 기존 베이스라인 대비 높은 견고성을 입증했습니다.

핵심 포인트

사후적 위임 학습(L2D)을 모델과 전문가의 이상적 분포 사이의 밀도비 학습 문제로 규정
밀도비 추정을 클래스 확률 추정(CPE)으로 환원하여 DR CPE 손실 함수 도출
임계값 설정을 통해 모델 재학습 없이 위임률(deferral rates)을 유연하게 조정 가능
Chow의 규칙과 전문가 편향 베이즈 사후 확률 간의 이론적 관계 복원
이상 탐지(anomaly detection) 등 관련 학습 설정과의 이론적 연결 고리 명확화

우리는 이상적인 분포(ideal distributions), 즉 모델이 낮은 손실을 달성하는 데이터 분포의 발산 정규화 재가중(divergence-regularized reweightings)이라는 관점을 통해 사후적 위임 학습 (Learning to Defer, L2D)을 연구합니다. 우리는 모델의 이상적 분포와 전문가의 이상적 분포 사이의 밀도비 (density-ratio)를 통해 위임 (deferral)을 정의합니다. 밀도비 추정 (density-ratio estimation)을 클래스 확률 추정 (class-probability estimation, CPE)으로 환원하는 방법을 사용하여, 사후적 L2D 스코어러 (scorers)를 위한 DR CPE 손실을 도출합니다. 이후 스코어러의 임계값 설정 (thresholding)을 통해 위임 결정을 내리며, 이를 통해 재학습 없이도 위임률 (deferral rates)을 조정할 수 있습니다. KL 기반의 이상적 분포의 경우, 우리의 위임 규칙은 이상적 분포가 결합 분포 (joint distributions)인지 또는 주변 분포 (marginal distributions)인지에 따라, 원래 분포에서의 Chow의 규칙 (Chow's rule)과 전문가의 성능을 통합하는 전문가 편향 베이즈 사후 확률 (expert-tilted Bayes posterior) 사이의 관계를 복원합니다. 실험적으로 우리의 접근 방식은 일반적인 베이스라인 (baselines)과 비교했을 때 경쟁력이 있으며, 데이터셋 설정 전반에 걸쳐 더 견고합니다 (robust). 더 넓게는, 우리의 결과는 사후적 L2D를 이상적 분포 간의 밀도비 학습 (density-ratio learning)으로 규정함으로써, Chow 스타일의 규칙과 전문가 비교를 연결하고 이상 탐지 (anomaly detection)를 포함한 관련 학습 설정과의 연결 고리를 명확히 합니다.

AI 자동 생성 콘텐츠

원문 바로가기

사후적 위임 학습 (Post-Hoc Learning to Defer)을 위한 밀도비 손실 (Density-Ratio Losses)

요약

핵심 포인트

댓글