본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 23. 23:47

상황 기반 대화 추천: 동적 및 암묵적 선호도 추론 (SiPeR)

요약

본 논문은 시각적 장면과 자연어 대화를 결합하여 맥락에 맞는 추천을 제공하는 '상황 기반 대화 추천(Situated Conversational Recommendation, SCR)' 분야의 복잡성을 다룹니다. 기존 방식보다 사용자의 동적이고 암묵적인 선호도 이해가 필수적이며, 주변 환경이 관심사에 큰 영향을 미치기 때문입니다. 이를 해결하기 위해 연구진은 새로운 프레임워크인 '상황 기반 선호도 추론(Situated Preference Reasoning, SiPeR)'을 제안했습니다. SiPeR은 (1) 현재 장면이 사용자 요구를 충

핵심 포인트

  • SiPeR은 시각적 장면과 대화를 통합하여 맥락적 추천을 수행하는 프레임워크입니다.
  • 핵심 메커니즘으로, 사용자의 필요도를 추정하는 '장면 전환 추정'과 다중 모드 LLM의 가능성을 활용한 '베이즈 역추론'을 사용합니다.
  • 실험 결과, SiPeR은 추천 정확도와 응답 생성 품질 모두에서 우수함을 입증했습니다.

상황 기반 대화 추천(Situated Conversational Recommendation, SCR)은 특정 환경의 시각적 장면과 자연어 대화를 활용하여 맥락에 맞는 추천을 제공하는 유망한 연구 분야입니다. 이 방식은 단순히 아이템을 나열하는 전통적인 추천 시스템보다 훨씬 복잡합니다. 왜냐하면 주변 환경 자체가 사용자의 잠재적 관심사에 영향을 미치고, 이러한 선호도는 대화가 진행됨에 따라 끊임없이 변화(동적)하며, 명시적으로 드러나지 않는 경우(암묵적)도 많기 때문입니다.

이러한 복잡성을 해결하기 위해 연구진은 '상황 기반 선호도 추론(Situated Preference Reasoning, SiPeR)'이라는 새로운 프레임워크를 제안했습니다. SiPeR은 두 가지 핵심 메커니즘을 통합합니다. 첫째는 **장면 전환 추정 (Scene transition estimation)**으로, 현재 장면이 사용자 요구사항을 충족하는지 판단하고 필요하다면 더 적절한 장면으로 사용자를 안내합니다. 둘째는 **베이즈 역추론 (Bayesian inverse inference)**입니다. 이는 다중 모드 대규모 언어 모델(MLLMs)의 가능성(likelihood)을 활용하여, 현재 장면에 있는 후보 아이템에 대한 사용자 선호도를 예측하는 방식입니다.

두 가지 대표적인 벤치마크에서 광범위하게 수행된 실험 결과, SiPeR이 추천 정확도와 응답 생성 품질 면에서 모두 기존 방법들보다 뛰어남을 입증했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0