SEARCH-R: Multi-hop 질문 답변을 위한 체인-of-추론 내비게이터를 활용한 구조화된 엔티티 인식 검색

멀티홉 질문 답변 (MHQA) 은 다단계 추론이 필요한 질문에 답하는 것을 목표로 합니다. 이는 복잡한 사용자 쿼리에 대한 올바른 추론 경로를 생성하고, 대형 언어 모델 (LLMs) 의 잠재적 한계에도 불구하고 필수 지식을 정확하게 검색한다는 두 가지 주요 과제를 제시합니다. 기존 접근법은 주로 프롬프트 기반 방법을 사용하여 추론 경로를 생성하며, 이를 전통적인 희소 또는 밀집 검색과 결합하여 최종 답변을 도출합니다. 그러나 추론 경로의 생성은 일반적으로 생성 과정에 대한 효과적인 통제를 결여하여 추론을 오도하게 됩니다. 또한, 검색 방법은 정보의 실용적 유용성을 평가하기보다 지식 매칭이나 유사성 점수에 지나치게 의존하여 동질적이거나 유용하지 않은 정보를 검색하는 결과를 초래합니다. 따라서 우리는 구조화된 엔티티 인식 검색 (Structured Entity-Aware Retrieval) 과 체인-of-추론 내비게이터 (Chain-of-Reasoning Navigator) 를 갖춘 프레임워크인 SEARCH-R 을 제안합니다. 구체적으로, SEARCH-R 은 Llama3.1-8B 모델을 미세 조정하여 강력한 하위 질문 분해기 (sub-question decomposer) 를 제공할 수 있는 엔드투엔드 추론 경로 내비게이터를 학습시킵니다. 또한, 문서의 정보 기여도를 정량적으로 평가하기 위해 새로운 의존성 트리 기반 검색 (dependency tree-based retrieval) 이 설계되었습니다. 제안된 프레임워크의 효과성은 세 가지 난이도 높은 멀티홉 데이터셋에 대한 광범위한 실험을 통해 검증되었습니다. 코드와 데이터셋은 다음 주소에서 구할 수 있습니다: https://github.com/Applied-Machine-Learning-Lab/ACL2026_SEARCH-R.

Insights

SEARCH-R: Multi-hop 질문 답변을 위한 체인-of-추론 내비게이터를 활용한 구조화된 엔티티 인식 검색

요약

핵심 포인트

댓글

Walmart 분기 실적 프리뷰: 알아야 할 사항

실적 프리뷰: Ross Stores의 보고서에서 기대할 수 있는 것

미국 메모리 주식의 하락, 투자자들에게 새로운 매수 기회 제공할 수도

Claude에게 물어본 Opus 5에서 변경하면 좋은 프롬프트 등의 개인적인 정리

Walmart 분기 실적 프리뷰: 알아야 할 사항

실적 프리뷰: Ross Stores의 보고서에서 기대할 수 있는 것

미국 메모리 주식의 하락, 투자자들에게 새로운 매수 기회 제공할 수도

Claude에게 물어본 Opus 5에서 변경하면 좋은 프롬프트 등의 개인적인 정리