arXiv논문2026. 05. 15. 20:39

이웃이 중요한 이유: Agentic GraphRAG에서의 탐색 컨텍스트(Traversal Context)와 출처(Provenance)

요약

본 논문은 Agentic GraphRAG 시스템에서 인용의 충실성(fidelity)을 단순히 최종 답변의 출처 지원 수준을 넘어, 전체 지식 그래프 탐색 궤적(trajectory-level)에 대한 '출처(provenance)' 개념으로 확장하여 정의합니다. 에이전트가 답변을 생성하는 과정에서 방문한 모든 구조와 엔티티까지 설명할 수 있어야 진정한 인용의 충실성을 확보할 수 있습니다. 실험 결과, 인용된 증거는 필수적이지만, 정확한 답변은 인용되지 않은 탐색 컨텍스트 및 주변 그래프 구조에도 의존한다는 점을 밝혀내며, 향후 GraphRAG 시스템 설계에 중요한 시사점을 제공합니다.

핵심 포인트

Agentic GraphRAG의 인용 충실성은 궤적 수준(trajectory-level) 문제로 정의되어야 한다.
진정한 출처(provenance)는 최종 인용뿐만 아니라, 답변 생성에 영향을 미친 전체 그래프 탐색 과정과 구조를 포함해야 한다.
인용된 엔티티 제거는 답변의 정확도를 크게 떨어뜨리지만, 인용되지 않은 탐색 컨텍스트 역시 답변에 필수적인 역할을 할 수 있다.
GraphRAG 시스템은 단순한 출처 지원을 넘어, 검색 궤적 전체에 대한 포괄적인 출처 추적 메커니즘을 갖추어야 한다.

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 외부 증거에 답변을 근거하게 함으로써 사실성을 향상할 수 있지만, Agentic GraphRAG는 인용 (citation)이 충실하다는 것이 무엇을 의미하는지를 복잡하게 만듭니다. 이러한 시스템에서 에이전트 (agent)는 답변과 소수의 인용 세트를 생성하기 전에 지식 그래프 (knowledge graph)를 탐색합니다. 우리는 인용의 충실성을 궤적 수준 (trajectory-level)의 문제로 정의합니다. 즉, 최종 인용은 답변을 뒷받침해야 할 뿐만 아니라, 답변에 영향을 미쳤을 수 있는 그래프 탐색 (graph traversal), 구조, 그리고 방문되었으나 인용되지 않은 엔티티 (visited-but-uncited entities)까지 설명할 수 있어야 합니다. 통제된 절제 실험 (ablation experiments)을 통해, 우리는 인용된 그래프 엔티티와 인용되지 않은 엔티티를 격리, 제거 및 마스킹 (masking)했을 때의 효과를 비교합니다. 우리의 결과는 인용된 증거가 종종 필수적임을 보여주는데, 이를 제거하면 답변이 실질적으로 변하고 정확도가 감소하기 때문입니다. 그러나 인용만으로는 충분하지 않은데, 정확한 답변이 인용되지 않은 탐색 컨텍스트 (traversal context)와 주변 그래프 구조에도 의존할 수 있기 때문입니다. 이러한 발견은 Agentic GraphRAG에서의 인용 평가가 단순한 출처 지원 (source support)을 넘어, 더 넓은 검색 궤적 (retrieval trajectory)에 대한 출처 (provenance)를 향해 나아가야 함을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

이웃이 중요한 이유: Agentic GraphRAG에서의 탐색 컨텍스트(Traversal Context)와 출처(Provenance)

요약

핵심 포인트

댓글