arXiv논문2026. 06. 30. 12:31

토큰 공생 그래프를 통한 효율적인 검색 증강 생성 (Efficient Retrieval-Augmented Generation via Token

요약

TIGRAG는 토큰 공생 지식 그래프를 활용하여 멀티홉 추론 성능을 개선한 효율적인 RAG 프레임워크입니다. 기존 그래프 RAG의 높은 계산 비용과 LLM 의존성을 해결하며, 인덱싱 및 추론 지연 시간을 대폭 단축했습니다.

핵심 포인트

토큰 공생 통계를 활용한 확장 가능한 그래프 구축
가교 엔티티를 이용한 반복적 엔티티 주도 검색 전략
기존 밀집 검색 및 그래프 RAG 대비 우수한 성능
인덱싱 시간, 추론 지연, 프롬프트 점유율의 실질적 감소

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 생성 과정을 외부 지식에 근거하게 함으로써 거대 언어 모델 (Large Language Models, LLMs)의 환각 (hallucinations) 현상을 완화합니다. 그러나 표준적인 RAG 방식은 멀티홉 추론 (multi-hop reasoning)에 어려움을 겪습니다. 최근의 그래프 기반 RAG 방법들은 서로 연결된 청크 (chunks)의 검색 성능을 개선했지만, 계산 비용이 많이 들고 오류가 발생하기 쉬운 LLM 기반 추출 파이프라인에 의존하는 경우가 많습니다. 이러한 문제를 해결하기 위해, 우리는 토큰 공생 지식 그래프 (token co-occurrence Knowledge Graph)에 기반한 효율적인 그래프 증강 RAG 프레임워크인 TIGRAG (Token-Induced GraphRAG)를 제안합니다. TIGRAG는 슬라이딩 윈도우 (sliding-window) 공생 통계를 사용하여 토큰 간의 위상적 관계 (topological relationships)를 직접 모델링함으로써 확장 가능한 그래프 구축을 가능하게 합니다. 추론 과정에서, 이는 그래프 기반의 의미론적 확장 (semantic expansion)과 신경망 재순위화 (neural reranking)를 결합하여 멀티홉 추론을 위한 상호 연결된 증거를 검색합니다. 구체적으로, 이 모델은 이전에 검색된 문맥에서 추출된 가교 엔티티 (bridging entities)를 사용하여 쿼리를 점진적으로 확장하는 반복적인 엔티티 주도 검색 (iterative entity-driven retrieval) 전략을 도입합니다. 우리는 널리 채택되는 세 가지 멀티홉 질의응답 (Question Answering, QA) 벤치마크에서 TIGRAG를 평가했습니다. 실험 결과, 우리의 프레임워크는 인덱싱 시간 (indexing time), 추론 지연 시간 (inference latency), 그리고 프롬프트 점유율 (prompt footprint)을 실질적으로 줄이면서도, 검색 및 다운스트림 QA 작업 모두에서 밀집 검색 (dense retrieval) 및 그래프 기반 RAG 방법보다 일관되게 우수한 성능을 보였습니다.

AI 자동 생성 콘텐츠

원문 바로가기

토큰 공생 그래프를 통한 효율적인 검색 증강 생성 (Efficient Retrieval-Augmented Generation via Token

요약

핵심 포인트

댓글