본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 12. 00:23

접지된 대화형 뉴스 추천을 위한 의도 기반 시맨틱 ID 생성

요약

본 기사는 빠르게 변화하는 아티클 코퍼스에서 사용자 의도에 기반한 뉴스 추천 시스템의 어려움을 다루고 있습니다. 특히 명시적 키워드가 부족한 암묵적인 사용자 의도를 처리하기 위해, 6가지 유형의 대화형 의도를 식별하고 그중 다섯 가지가 기존 RAG 파이프라인의 병목 현상을 야기함을 지적합니다. 이를 해결하기 위해 'Generate-then-Match' 패러다임 하에서 다중 작업 학습과 GPT-4 CoT 증류를 활용하여 의도 기반 시맨틱 ID(SID) 생성 방법을 제안합니다.

핵심 포인트

  • 대화형 뉴스 추천은 아티클 코퍼스에 대한 '접지(grounding)'가 필수적이며, 암묵적인 사용자 의도를 다루는 것이 핵심 과제입니다.
  • 기존 RAG 파이프라인은 명시적 키워드가 부족한 암묵적 의도 처리에서 근본적인 어려움과 검색 우선 병목을 겪습니다.
  • 'Generate-then-Match' 패러다임 하에 의도 기반 시맨틱 ID(SID) 생성을 도입하여 이 문제를 해결합니다.
  • 제안된 방법은 다중 작업 SID 정렬 및 GPT-4 Chain-of-Thought 증류를 포함하는 2단계 학습 구조를 사용합니다.

대화형 뉴스 추천은 빠르게 변화하는 아티클 코퍼스에 각 제안을 접지(grounding)해야 하며, 명시적으로 검색 가능한 키워드가 부족한 암묵적인 사용자 의도를 다루어야 합니다. 이 시나리오를 특성화하기 위해, 우리는 프로덕션 대화에서 6가지 의도 유형을 식별했습니다: 그중 다섯 가지는 암묵적이며 표준 RAG 파이프라인에 근본적인 어려움을 제기하며, 중요한 검색 우선 병목(retrieve-first bottleneck)을 형성합니다. 이러한 문제를 해결하기 위해, 우리는 Generate-then-Match 패러다임 하에서 의도 기반 시맨틱 ID (SID) 생성을 도입합니다. 다중 작업 SID 정렬과 GPT-4 Chain-of-Thought 증류로 구성된 2단계 학습을 통해, LLM은 다양한 의도를 h

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0