검색 증강 언어적 교정 (Retrieval-Augmented Linguistic Calibration)

"I believe"나 "probably"와 같은 언어적 단서 (Linguistic cues)는 확신을 전달하는 직관적인 인터페이스를 제공하지만, 언어적 확신 표현을 위한 일반화 가능하고 원칙적인 교정 (Calibration) 프레임워크는 여전히 미개척 분야로 남아 있습니다. 특히, 함께 나타나는 언어적 단서, 문맥적 변동성, 그리고 청중의 주관적 해석은 독특한 과제를 제기합니다. 따라서 우리는 언어적 확신을 문장이 옳다는 것에 대해 그럴듯하게 인지된 확률 값 (Perceived probability values)의 분포로 모델링하여, 스칼라 (Scalar) 표현 방식이 버리는 해석의 가변성을 포착합니다. 이러한 분포적 프레임워크 내에서, 우리는 충실도 (Faithfulness)를 보완적인 평가 차원으로 도입하고, 진실이 밝혀졌을 때 청중의 믿음에 유도된 놀라움을 정량화하는 정보 이론적 지표인 충실도 발산 (Faithfulness Divergence, FD)을 제시합니다. 이러한 토대 위에, 우리는 검색 증강 재작성 (Retrieval-augmented rewriting)을 통해 교정된 확신 신호를 자연어로 다시 전파하는 경량화된 사후 처리 (Post-hoc) 파이프라인인 검색 증강 언어적 교정 (Retrieval-Augmented Linguistic Calibration, RALC)을 선보입니다. 세 가지 질의응답 (QA) 벤치마크와 다섯 가지 LLM 제품군에 걸쳐, RALC는 도메인 내 충실도와 교정 성능을 각각 최대 66%와 58%까지 향상시켰으며, 블랙박스 (Black-box) 및 그레이박스 (Grey-box) 교정 베이스라인 모델들을 능가했습니다.

Insights

검색 증강 언어적 교정 (Retrieval-Augmented Linguistic Calibration)

요약

핵심 포인트

댓글

PALS: LLM 가지치기를 위한 분위수 인식 계층별 희소성

이란 휴전 끝난 트럼프, 호르무즈 해협 전투로 전환

PeTeR: 확률적 회로의 학습 후 강건화 (Post-Training Robustification of Probabilistic

GRPO 신호 극대화: 난이도 문제에 대한 적응형 트레이스 접두사 제어

PALS: LLM 가지치기를 위한 분위수 인식 계층별 희소성

이란 휴전 끝난 트럼프, 호르무즈 해협 전투로 전환

PeTeR: 확률적 회로의 학습 후 강건화 (Post-Training Robustification of Probabilistic

GRPO 신호 극대화: 난이도 문제에 대한 적응형 트레이스 접두사 제어