본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 17. 11:59

FlowRAG: 빈도 인식 다중 입도 그래프 흐름을 통한 명시적 추론의 시너지 효과

요약

FlowRAG는 기존 GraphRAG의 검색 부족 및 노이즈 문제를 해결하기 위해 제안된 의미론적 인식 검색 프레임워크입니다. 4단계 이종 그래프와 이중 입도 활성화 모듈을 통해 추상적인 쿼리에서도 높은 재현율을 보장하며, 빈도 인식 가중치 흐름을 통해 신뢰할 수 있는 추론 경로를 추출합니다.

핵심 포인트

  • 구절, 요약, 문장, 엔티티를 포함하는 4단계 이종 그래프 구축
  • 이중 입도 활성화 모듈로 추상적 쿼리에 대한 검색 성능 개선
  • 빈도 인식 가중치 흐름을 통한 노이즈 제거 및 명시적 추론 경로 확보
  • 복잡한 추론 벤치마크에서 SOTA 성능 달성

그래프 기반 검색 증강 생성 (GraphRAG)은 지식 집약적이고 다중 홉 (multi-hop) 쿼리 작업에 효과적입니다. 그러나 기존의 많은 방법들은 주로 엔티티 (entity) 기반의 그래프를 시드(seed)로 사용하며 암시적인 의미론적 관련성 전파에 의존합니다. 이는 종종 (i) 사용자 쿼리가 추상적이고 엔티티 수준에서 의미론적으로 희소할 때 검색 부족(under-retrieval)을 야기하며, (ii) 노이즈가 섞인 활성화가 엔티티 간 전이를 방해하고 추론된 관계 체인을 손상시켜 신뢰할 수 없는 결론을 도출하는 취약한 다중 홉 추론 문제를 겪게 합니다. 이를 해결하기 위해, 우리는 의미론적 재현율 (semantic recall)과 명시적 추론 (explicit reasoning)을 모두 개선하는 의미론적 인식 검색 프레임워크인 \texttt{FlowRAG}를 제안합니다. 구체적으로, \texttt{FlowRAG}는 구절 (passages), 요약 (summaries), 문장 (sentences), 그리고 엔티티 (entities)에 대해 4단계 이종 그래프 (quad-level heterogeneous graph)를 구축하며, 여기서 요약 노드는 거친 의미론적 허브 (coarse semantic hub) 역할을 합니다. 검색 시점에는 이중 입도 활성화 (dual-granularity activation) 모듈이 요약-쿼리 정렬과 문장 수준 매칭을 결합하여, 바꾸어 말하기 (paraphrase) 및 추상화 상황에서도 관련 엔티티를 견고하게 활성화합니다. 그런 다음, 우리는 빈도 인식 가중치 흐름 (frequency-aware weighted flow) 모듈을 도입하여 구절 내 단어 빈도 (within-passage term frequency)에 따라 가중치가 부여된 엔티티-구절 링크를 통해 관련성을 라우팅하며, 노이즈가 있는 연결을 가지치기하고 생성을 위한 명시적 논리 골격으로서 신뢰도 높은 추론 경로를 추출합니다. 광범위한 실험을 통해 \texttt{FlowRAG}가 복잡한 추론 벤치마크에서 최첨단 (state-of-the-art) 성능을 달성함을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0