접지된 대화형 뉴스 추천을 위한 의도 기반 시맨틱 ID 생성

대화형 뉴스 추천은 빠르게 변화하는 아티클 코퍼스에 각 제안을 접지(grounding)해야 하며, 명시적으로 검색 가능한 키워드가 부족한 암묵적인 사용자 의도를 다루어야 합니다. 이 시나리오를 특성화하기 위해, 우리는 프로덕션 대화에서 6가지 의도 유형을 식별했습니다: 그중 다섯 가지는 암묵적이며 표준 RAG 파이프라인에 근본적인 어려움을 제기하며, 중요한 검색 우선 병목(retrieve-first bottleneck)을 형성합니다. 이러한 문제를 해결하기 위해, 우리는 Generate-then-Match 패러다임 하에서 의도 기반 시맨틱 ID (SID) 생성을 도입합니다. 다중 작업 SID 정렬과 GPT-4 Chain-of-Thought 증류로 구성된 2단계 학습을 통해, LLM은 다양한 의도를 h