추론 시점 논증을 위한 신경 기호 학습 (Neurosymbolic Learning for Inference-Time Argumentation)
요약
본 논문은 의료 및 금융과 같은 고위험 환경에서 불완전하거나 상충하는 정보에 대응하기 위해 3진 주장 검증(참/거짓/불확실)을 수행하는 신경 기호(neurosymbolic) 프레임워크인 ITA를 제안합니다. ITA는 형식적 논증 의미론을 활용하여 모델이 논증을 생성하고 점수를 매기도록 학습하며, 추론 시에는 사후 설명이 아닌 구조적으로 검증 가능한 논증을 바탕으로 최종 판결을 도출합니다. 실험 결과, ITA는 기존 논증 기반 모델보다 우수한 성능을 보였으며 비논증적 직접 예측 모델과 경쟁할 수 있는 수준의 성능과 함께 명시적인 검사 가능성을 제공합니다.
핵심 포인트
- 3진 주장 검증(참, 거짓, 불확실)을 위한 학습 가능한 신경 기호 프레임워크 ITA 소개
- 형식적 논증 의미론을 사용하여 LLM의 논증 생성 및 점수 부여 과정을 가이드
- 사후 추론(post-hoc reasoning)이 아닌, 생성된 논증과 점수에 기반한 구조적이고 충실한(faithful) 예측 제공
- 기존 논증 기반 베이스라인 대비 성능 향상 및 비논증적 직접 예측 모델과 경쟁 가능한 성능 입증
- 명시적이고 검사 가능한 논증 구조를 통해 결정론적인 판결 도출 가능
주장 검증 (Claim verification)은 의료 및 금융을 포함한 고위험 환경에서 중요한 문제입니다. 주장을 뒷받침하는 정보가 불완전하거나 상충할 때, 이진(binary) 참 또는 거짓 분류보다는 불확실한 답변이 더 적절할 수 있습니다. 모든 경우에 있어, 최종 판결을 결정하는 고려 사항들에 대한 충실한 설명 (faithful explanations)은 매우 중요합니다. 본 논문에서는 3진 주장 검증 (ternary claim verification)을 위한 학습 가능한 신경 기호 (neurosymbolic) 프레임워크인 추론 시점 논증 (inference-time argumentation, ITA)을 소개합니다. 이 프레임워크에서는 주장의 강도를 나타내는 형식적 논증 의미론 (formal argumentation semantics)이 다음 두 가지 용도로 사용됩니다: (i) 모델이 논증을 생성하고 이에 기초 점수 (base scores, 내재적 강도를 나타냄)를 부여하는 법을 학습함에 따라 LLM 학습을 가이드하는 용도, 그리고 (ii) 생성되고 점수가 매겨진 논증으로부터 3진 (참/거짓/불확실) 예측을 계산하는 용도입니다. 그 결과, 학습 시에는 유도된 논증적 예측의 품질에 따라 논증 생성 및 점수 매기기를 최적화할 수 있습니다. 또한, 추론 시에는 기존의 추론 모델들처럼 잠재적으로 불충실한 사후 추론 과정 (post-hoc reasoning trace)에 의해 정당화되는 것이 아니라, 구조적으로 판결을 결정하는 논증과 점수에 충실한 최종 예측을 제공합니다. 마지막으로, 우리는 3진 주장 검증을 위한 두 개의 데이터셋에서 ITA가 논증 기반 베이스라인 (argumentative baselines)보다 성능을 개선하며, 비논증적 직접 예측 베이스라인 (non-argumentative direct-prediction baselines)과 경쟁할 수 있는 성능을 보이면서도, 명시적이고 검사 가능한 논증 구조로부터 결정론적으로 계산된 판결을 제공함을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기