DiffCold: 콜드 스타트 아이템 추천을 위한 확산 기반 생성 모델
요약
본 논문은 상호작용 이력 부재로 발생하는 콜드 스타트 아이템 추천 문제를 해결하기 위해 DiffCold라는 확산 기반 생성 모델을 제안합니다. 기존 방법들이 겪는 '시소 딜레마'를 극복하고자, DiffCold는 조건부 확산을 활용하여 콘텐츠로부터 따뜻한 아이템 임베딩을 재구성하며 매니폴드 구조 보존에 중점을 둡니다.
핵심 포인트
- DiffCold는 콜드 스타트 추천의 '시소 딜레마'를 해결하는 생성 모델입니다.
- 조건부 확산을 사용하여 콘텐츠 기반으로 따뜻한 아이템 임베딩을 재구성합니다.
- 검색 강화 집계기와 시뮬레이션 기반 표현 정렬 모듈로 성능을 개선했습니다.
콜드 스타트(cold-start) 아이템 추천은 상호작용 이력의 부재로 인해 실제 시스템에서 지속적인 난제로 남아 있습니다. 기존 모델들은 아이템 콘텐츠 특징을 사용하여 이 격차를 메우려고 시도하지만, 보편적으로 extbf{시소 딜레마(seesaw dilemma)}에 시달립니다. 즉, 콜드 아이템의 성능을 향상시키면 따뜻한(warm) 아이템의 성능이 필연적으로 저하되고, 그 반대도 마찬가지입니다. 우리는 이 딜레마가 근본적인 extbf{분포 불일치(distributional disparity)}에서 비롯된다고 파악했습니다. 즉, 따뜻한 아이템 임베딩은 풍부한 상호작용 신호에 의해 형성된 복잡한 '행동 매니폴드(behavioral manifold)'를 차지하는 반면, 콜드 아이템 임베딩은 오직 보조 콘텐츠에서 파생된 '의미론적 매니폴드(semantic manifold)'에 국한됩니다. 기존 방법들은 종종 이 불일치한 공간들 사이에 경직된 매핑을 강제하여, 모델이 콜드 아이템을 수용하기 위해 따뜻한 표현의 정밀도를 희생하도록 만듭니다. 이를 해결하기 위해, 우리는 따뜻한 것과 콜드한 것을 통합하는 확산 기반 생성 모델인 extbf{DiffCold}를 제안합니다. GAN이나 VAE와 달리, DiffCold는 조건부 확산(conditional diffusion)을 활용하여 콘텐츠로부터 따뜻한 아이템 임베딩을 재구성함으로써, 저하 없이 근본적인 매니폴드 구조를 보존합니다. 우리는 또한 이 패러다임을 두 가지 특정 설계를 통해 맞춤화했습니다: 비효율적인 노이즈를 우회하기 위해 의미론적으로 유사한 따뜻한 아이템을 사용하여 생성을 초기화하는 extbf{검색 강화 집계기(Retrieval-enhanced Aggregator)}와, 대조 학습(contrastive learning)을 통해 생성된 임베딩과 실제 임베딩 간의 분포 일관성을 강제하는 extbf{시뮬레이션 기반 표현 정렬(Simulation-based Representation Alignment)} 모듈입니다. 세 가지 벤치마크에서 수행한 실험은 DiffCold가 시소 딜레마를 해결하고, 모든 지표에서 최신 기술 방법론을 지속적으로 능가함을 확인시켜 줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기