불확실성 정량화 (Uncertainty Quantification)를 통한 오류 예측에서의 모호성의 역할
요약
본 논문은 LLM의 오류 예측 성능을 높이기 위해 불확실성 정량화(UQ) 신호에서 입력의 모호성을 분리하는 방법을 제안합니다. 실험 결과, 모호성 정보를 활용함으로써 다양한 모델과 데이터셋 환경에서 오류 예측 점수를 크게 향상시켰습니다.
핵심 포인트
- UQ 지표와 입력의 모호성을 분리하여 오류 예측 개선
- 모호한 질문보다 명확한 질문에서 UQ의 오류 예측력이 높음
- Gated Experts 및 Selective Prediction을 통한 모호성 통합
- 표준 데이터셋에서 개별 UQ 지표 대비 PRR 10포인트 이상 향상
오류 예측 (Error Prediction), 즉 모델의 출력이 올바른지 여부를 예측하는 작업은 일반적으로 불확실성 정량화 (Uncertainty Quantification, UQ)를 통해 다루어집니다. 그러나 불확실성 지표 (uncertainty metrics)가 모델의 지식이나 예측 능력의 부족을 포착하는 동안, 이는 모델 입력과 문맥에 내재된 우연적 불확실성 (aleatoric uncertainty) 또한 반영합니다. 본 논문은 입력의 모호성 (ambiguity)을 UQ 신호로부터 분리함으로써 대규모 언어 모델 (Large Language Models, LLMs)의 오류 예측을 개선하는 방법을 제시합니다. 우리는 6가지 UQ 지표를 사용하여 질의응답 (Question Answering, QA) 작업에 대해 실험을 수행하였으며, UQ 지표가 여러 개의 그럴듯한 답이 있는 질문보다 모호하지 않은 사례 (unambiguous instances)에서의 오류를 더 잘 예측한다는 것을 보여줍니다. 우리는 게이트 전문가 (Gated Experts) 및 선택적 예측 (Selective Prediction)을 사용하여 정답 및 예측된 모호성 레이블을 오류 예측 파이프라인에 통합합니다. 우리는 모호성 정보가 모델 제품군, 학습 및 평가 패러다임, 데이터셋 (소위 모호하지 않다고 여겨지는 데이터셋 포함), 그리고 우연적 불확실성 (aleatoric uncertainty)의 원천 전반에 걸쳐 오류 예측 점수를 향상시킨다는 것을 발견하였으며, 표준 데이터셋에서 개별 UQ 지표에 대해 10포인트 이상의 PRR 향상을 달성했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기