SemEval-2026 Task 8 제출: H-RAG (계층적 부모-자식 검색을 통한 다중 턱 RAG 대화)

우리는 SemEval-2026 Task 8 (MTRAGEval) 에 제출한 H-RAG 를 소개합니다. H-RAG 는 Task A (검색) 과 Task C (검색된 문서를 활용한 생성) 을 모두 해결합니다. Task A 는 독립형 검색 품질을 평가하고, Task C 는 다중 턱 대화 환경에서의 엔드 투 엔드 검색 증강 생성 (RAG) 을 평가하며, 정확한 답변 생성과 검색된 증거에 대한 충실한 근거 제시를 요구합니다. 우리의 접근법은 생성 과정에서 세밀한 자식 수준 검색과 부모 수준 맥락 재구성을 분리하는 계층적 부모-자식 RAG 파이프라인을 구현합니다. 문서는 겹치는 구문 기반 자식 청크로 분할되고, 전체 문서가 부모 단위로 보존되어 일관된 맥락을 제공합니다. 검색은 하이브리드 밀도 희소 검색, 조정 가능한 가중치, 그리고 자식 청크에 대한 임베딩 기반 유사성 재평가 (rescoring) 를 결합합니다. 검색된 증거는 부모 수준에서 집계되어 응답 생성을 위한 지시 튜닝 언어 모델에 공급됩니다. H-RAG 는 Task A 에서 nDCG@5 점수가 0.4271, Task C 에서 조화 평균 점수가 0.3241 (RB_agg: 0.2488, RL_F: 0.2703, RB_llm: 0.6508) 을 달성하여 다중 턱 RAG 성능에서 검색 설정과 부모 수준 집계 (aggregation) 의 중요성을 강조합니다.

Insights

SemEval-2026 Task 8 제출: H-RAG (계층적 부모-자식 검색을 통한 다중 턱 RAG 대화)

요약

핵심 포인트

댓글

AI 인프라 논쟁이 진화함에 따라 Nvidia, Vera CPU 전략 강조

영국 데이터 센터 소유주, 140억 파운드 규모의 미국 기업 인수 제안 수용 예정

디지털 자산을 위한 새로운 벤치마크 지수 등장 — 비트코인은 제외되었다

Bank of America, AI 돌발 변수 이후 Micron 주식에 대한 투자 강화

영국 데이터 센터 소유주, 140억 파운드 규모의 미국 기업 인수 제안 수용 예정

디지털 자산을 위한 새로운 벤치마크 지수 등장 — 비트코인은 제외되었다

Bank of America, AI 돌발 변수 이후 Micron 주식에 대한 투자 강화