SemEval-2026 Task 8: 학습된 희소 검색 및 리스트와이즈 재순위화를 사용한 다중 턴 RAG
요약
본 보고서는 SemEval-2026 Task 8에 참여한 다중 턴 RAG 시스템을 소개합니다. 이 태스크는 금융, 클라우드 문서 등 다양한 도메인에서 대화형 질의응답 능력을 평가하며, 제안된 파이프라인은 학습된 희소 검색과 LLM 기반 재순위화를 결합했습니다. 이를 통해 전체 대화 기록을 조건으로 답변의 견고성을 높였습니다.
핵심 포인트
- SemEval-2026 Task 8에서 다중 턴 RAG 시스템 평가 결과를 제시함.
- 학습된 희소 검색과 LLM 기반 재순위화를 결합한 파이프라인을 사용함.
- 대화형 컨텍스트를 통합하여 도메인 전반의 견고성을 향상시킴.
본 보고서는 다중 턴 검색 및 질의응답에 대한 SemEval-2026 Task 8 참여 결과를 설명합니다. 이 태스크는 네 가지 도메인(금융, 클라우드 문서, 정부, Wikipedia) 전반에 걸쳐 대화형 시스템을 평가하며, 사용 가능한 컬렉션이 완전한 응답을 생성하기에 충분한 증거를 포함하지 않는 답변 불가 질의도 포함합니다. 저희는 학습된 희소 검색과 LLM 기반 재순위화 및 생성을 결합한 다중 턴 검색 증강 생성(RAG) 파이프라인을 제안합니다. 주요 검색 방법으로 희소 검색을 활용하여 도메인 전반에 걸친 강력한 일반화 능력을 이용합니다. 또한, 대화형 질의 재작성, 포인트와이즈 및 리스트와이즈 재순위화, 최종 응답 생성에 LLM의 장문맥(long-context) 기능을 사용하여 각각 전체 대화 기록을 조건으로 합니다. 이 다단계 설계는 검색과 생성 전반에 걸쳐 대화형 컨텍스트를 효과적으로 통합할 수 있게 하여 도메인 전반의 견고성을 향상시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기