arXiv논문2026. 06. 10. 11:15

필요한 것만 추적하라: 긴 문서 질의응답을 위한 구조 인식 온디맨드 하이퍼그래프 메모리

요약

긴 문서 QA의 한계를 극복하기 위해 문서 구조를 인식하고 온디맨드 하이퍼그래프 메모리를 사용하는 DocTrace 프레임워크를 제안합니다. 이 방식은 문서 계층 구조를 보존하고 추론 경험을 재사용하여 성능을 높이고 비용을 절감합니다.

핵심 포인트

문서 계층 구조를 보존하는 경량 트리 인덱스 활용
온디맨드 하이퍼그래프 기반의 멀티 에이전트 RAG 구축
성공적인 추론 계획을 경험 메모리에 저장하여 재사용
기존 ComoRAG 대비 F1 점수 최대 8.85% 향상
전체 계산 비용을 53.32% 절감하는 효율성 달성

긴 문서 질의응답 (Long-document QA)은 대규모 언어 모델 (LLMs)이 긴 문서에 흩어져 있는 증거를 바탕으로 추론할 것을 요구하며, 여기서 정답은 종종 사건의 순서, 섹션 수준의 문맥, 그리고 부분 간의 증거 연결에 의존합니다. 검색 증강 생성 (RAG)은 관련 증거를 검색하여 입력 문맥을 줄여주지만, 기존의 구조화된 RAG 방식들은 여전히 세 가지 한계에 직면해 있습니다: 비용이 많이 드는 쿼리 불가지론적 (query-agnostic) 지식 조직, 원본 문서 구조의 불충분한 활용, 그리고 과거 추론 경험의 재사용 불가입니다. 이러한 한계를 해결하기 위해, 우리는 쿼리 트리거 방식의 지식 조직, 문서 구조 인식 및 경험 가이드 추론을 지원하는 긴 문서 QA용 멀티 에이전트 RAG 프레임워크인 DocTrace를 제안합니다. DocTrace는 경량 문서 구조 트리 인덱스를 통해 문서 계층 구조를 보존하고, 추론 과정 중 온디맨드 (on-demand)로 에이전트 공유 하이퍼그래프 (hypergraph) 구조의 작업 메모리를 구축하며, 성공적인 추론 계획을 그래프 구조의 경험 메모리에 저장하여 향후 재사용할 수 있도록 함으로써 관련 긴 문서 질문들에 대한 적응형 탐색을 가능하게 합니다. 네 가지 긴 문서 QA 데이터셋에 대한 실험 결과, DocTrace는 세 가지 데이터셋에서 최고의 성능을 달성하였으며, 가장 강력한 베이스라인인 ComoRAG를 F1 점수에서 최대 8.85%, EM (Exact Match)에서 4.40% 상회하는 동시에 전체 계산 비용을 53.32% 절감했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

필요한 것만 추적하라: 긴 문서 질의응답을 위한 구조 인식 온디맨드 하이퍼그래프 메모리

요약

핵심 포인트

댓글