arXiv논문2026. 06. 08. 10:33

구조화된 인라인 인용 생성을 통한 명시적 증거 근거 제시 (Explicit Evidence Grounding via Structured

요약

FullCite는 각 주장을 소스 문서 및 증거와 연결하는 구조화된 인라인 인용 생성 프레임워크를 제안합니다. 프롬프트 기반 생성, 제약된 디코딩, 사후 스팬 정렬 전략을 통해 인용의 정확성과 충실성을 높이는 연구를 다룹니다.

핵심 포인트

FullCite 프레임워크를 통한 구조화된 인라인 인용 생성
프롬프트, 제약된 디코딩, 사후 스팬 정렬의 세 가지 전략 제안
LLM이 문서 식별은 잘하나 정확한 증거 스팬 식별에는 한계가 있음
충실한 출처 기반 QA를 위한 증거 스팬 식별 연구의 중요성 강조

AI 시스템이 더욱 널리 채택됨에 따라, 사실적이고 충실한 생성 (faithful generation)에 대한 요구가 커지고 있습니다. 따라서 인용 (citations)을 통해 정보를 적절히 출처를 밝히는 것이 매우 중요해졌습니다. 본 연구는 대부분의 이전 연구들과 달리, 각 주장 (claim)을 소스 문서 및 이를 뒷받침하는 증거 (supporting evidence) 모두와 연결하는 구조화된 인라인 인용 (structured inline citations)을 생성하는 프레임워크인 FullCite를 소개합니다. FullCite는 인라인 인용 생성을 위해 세 가지 전략, 즉 프롬프트 기반 생성 (prompt-based generation), 인용 문법에 따른 제약된 디코딩 (constrained decoding over a citation grammar), 그리고 사후 스팬 정렬 (posthoc span alignment)을 제안합니다. ASQA, BioASQ, ExpertQA라는 세 가지 질의응답 (question answering) 벤치마크를 사용하여, 우리는 문서 수준의 정확성 (document-level correctness), 증거 스팬 식별 (evidence span identification), 그리고 주장-인용 충실성 (claim-citation faithfulness)이라는 세 가지 차원에서 인용 품질과 충실성을 평가합니다. 우리의 평가 결과에 따르면, 대규모 언어 모델 (LLMs)은 일반적으로 관련 문서를 식별하는 데는 효과적이지만, 문서 내에서 정확한 뒷받침 스팬 (supporting spans)을 식별하는 데는 어려움을 겪는 것으로 나타났습니다. 이러한 격차는 충실한 출처 기반 질의응답 (attributed QA)을 달성하기 위해서는 정확한 증거 스팬 식별에 더 큰 비중을 두는 연구가 필요함을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

구조화된 인라인 인용 생성을 통한 명시적 증거 근거 제시 (Explicit Evidence Grounding via Structured

요약

핵심 포인트

댓글