딥러닝을 위한 가능성론적 예측 불확실성: DAPPr 프레임워크 소개
요약
본 논문은 딥러닝 모델의 과신 문제를 해결하고 신뢰할 수 있는 인식 불확실성 모델링을 제공하는 DAPPr(Dirichlet-approximated possibilistic posterior predictions) 프레임워크를 소개합니다. 기존 베이지안 접근법의 높은 계산 비용과 다른 예측자들의 이론적 한계를 극복하기 위해, 이 방법은 가능성론을 활용하여 파라미터 후경을 정의하고 이를 디리클레 근사 함수로 효율적으로 학습합니다. 실험 결과, DAPPr는 원칙적인 유도와 계산 효율성을 유지하면서 최첨단 딥러닝 불확실성 정량화 성능을 달성함을 입증했습니다.
핵심 포인트
- 딥러닝 모델의 과신(overconfidence) 문제를 해결하기 위해 신뢰할 수 있는 인식 불확실성 모델링이 필수적이다.
- DAPPr 프레임워크는 가능성론(possibility theory)을 기반으로 하며, 베이지안 접근법의 높은 계산 비용과 이론적 한계를 극복한다.
- 핵심 방법론은 파라미터에 대한 가능성론적 후경을 정의하고, 이를 상극 연산자를 통해 예측 공간으로 투영한 뒤 디리클레 함수로 근사하는 것이다.
- DAPPr는 원칙적인 유도와 계산 효율성을 동시에 확보하며, 다양한 벤치마크에서 우수한 불확실성 정량화 성능을 보여준다.
심층 신경망은 다양한 응용 분야에서 놀라운 성과를 이루고 있지만, 새로운 입력에 대한 과신 (overconfidence) 이 존재하기 때문에 신뢰할 수 있는 인식 불확실성 모델링이 필요합니다. 기존 불확실성 모델링 방법들은 근본적인 딜레마에 직면해 있습니다: 베이지안 접근법은 원칙적인 추정을 제공하지만 계산 비용이 과도하게 높고, 효율적인 2 차 예측자는 특정 목표와 인식 불확실성 정량화 사이의 엄밀한 유도 (rigorous derivations) 를 결여하고 있습니다. 이 딜레마를 해결하기 위해 우리는 가능성론 (possibility theory) 을 활용하는 원칙적인 프레임워크인 디리클레 근사 가능성론적 후경 예측 (Dirichlet-approximated possibilistic posterior predictions, DAPPr) 을 소개합니다. 우리는 파라미터에 대한 가능성론적 후경을 정의하고, 이를 상극 연산자 (supremum operators) 를 통해 예측 공간으로 투영하며, 투영된 후경을 학습 가능한 디리클레 가능성 함수로 근사합니다. 이 투영 및 근사 전략은 폐쇄형 해를 가지는 간단한 학습 목표를 제공합니다. 다양한 벤치마크에 걸친 광범위한 실험结果表明 (demonstrate) , 우리 접근법은 최첨단 증거 기반 딥러닝 방법과 비교하여 경쟁적이거나 우수한 불확실성 정량화 성능을 달성하면서도 원칙적인 유도 및 계산 효율성을 유지합니다. 코드는 https://github.com/MaxwellYaoNi/DAPPr 에서 사용할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기