본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 04. 19:43

SemEval-2026 Task 8 제출: H-RAG (계층적 부모-자식 검색을 통한 다중 턱 RAG 대화)

요약

본 기술 기사는 SemEval-2026 Task 8(MTRAGEval)에 제출된 H-RAG라는 새로운 계층적 부모-자식 RAG 시스템을 소개한다. 이 시스템은 독립적인 검색 품질 평가(Task A)와 다중 턴 대화 환경에서의 엔드투엔드 RAG 성능 평가(Task C)를 모두 해결하는 것을 목표로 한다. H-RAG는 세밀한 자식 청크 기반의 검색과 부모 수준 맥락 재구성을 분리하여, 하이브리드 검색 및 지시 튜닝된 언어 모델을 통해 일관되고 근거가 충실한 답변 생성을 구현한다.

핵심 포인트

  • H-RAG는 SemEval-2026 Task 8의 두 가지 핵심 평가 영역(독립 검색 및 다중 턴 RAG)을 모두 포괄적으로 해결하는 프레임워크이다.
  • 시스템은 세밀한 자식 청크로 분할된 문서와 전체 문맥을 보존하는 부모 단위 맥락을 결합한 계층적 구조를 사용한다.
  • 검색 과정에서는 하이브리드 검색(희소+밀도)과 자식 청크에 대한 임베딩 기반 재평가(rescoring)를 결합하여 정확도를 높인다.
  • 최종적으로, 검색된 증거는 부모 수준에서 집계되어 응답 생성을 위한 지시 튜닝 언어 모델에 공급된다.
  • H-RAG의 높은 성능 점수(Task A: nDCG@5=0.4271, Task C: 조화 평균=0.3241)는 검색 설정과 부모 수준 맥락 집계의 중요성을 입증한다.

우리는 SemEval-2026 Task 8 (MTRAGEval) 에 제출한 H-RAG 를 소개합니다. H-RAG 는 Task A (검색) 과 Task C (검색된 문서를 활용한 생성) 을 모두 해결합니다. Task A 는 독립형 검색 품질을 평가하고, Task C 는 다중 턱 대화 환경에서의 엔드 투 엔드 검색 증강 생성 (RAG) 을 평가하며, 정확한 답변 생성과 검색된 증거에 대한 충실한 근거 제시를 요구합니다. 우리의 접근법은 생성 과정에서 세밀한 자식 수준 검색과 부모 수준 맥락 재구성을 분리하는 계층적 부모-자식 RAG 파이프라인을 구현합니다. 문서는 겹치는 구문 기반 자식 청크로 분할되고, 전체 문서가 부모 단위로 보존되어 일관된 맥락을 제공합니다. 검색은 하이브리드 밀도 희소 검색, 조정 가능한 가중치, 그리고 자식 청크에 대한 임베딩 기반 유사성 재평가 (rescoring) 를 결합합니다. 검색된 증거는 부모 수준에서 집계되어 응답 생성을 위한 지시 튜닝 언어 모델에 공급됩니다. H-RAG 는 Task A 에서 nDCG@5 점수가 0.4271, Task C 에서 조화 평균 점수가 0.3241 (RB_agg: 0.2488, RL_F: 0.2703, RB_llm: 0.6508) 을 달성하여 다중 턱 RAG 성능에서 검색 설정과 부모 수준 집계 (aggregation) 의 중요성을 강조합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0