arXiv논문2026. 05. 21. 10:52

MNAR 상황에서 숨겨진 혼란 변수가 존재할 때의 강건한 개인화 추천

요약

본 논문은 MNAR(Missing Not At Random) 상황에서 숨겨진 혼란 변수로 인해 발생하는 추천 시스템의 선택 편향 문제를 해결하기 위한 새로운 프레임워크 PUID를 제안합니다. 기존의 전역 민감도 경계 방식이 가진 균일성 가정의 한계를 극복하기 위해 사용자-아이템 수준의 민감도 경계를 추정하며, 적대적 최적화와 BPUID 모델을 통해 강건성과 예측 정확도를 동시에 확보했습니다.

핵심 포인트

숨겨진 혼란 변수가 존재하는 MNAR 상황에서의 추천 시스템 선택 편향 완화
전역 민감도 경계의 한계를 극복하는 사용자-아이템 수준의 개인화된 민감도 경계 추정
강건성 및 정확도 향상을 위한 적대적 최적화(Adversarial Optimization) 전략 도입
사전 학습된 모델을 활용하여 안정성을 높인 BPUID 모델 제안
실제 데이터셋 실험을 통해 RCT 없이도 기존 전역 방식보다 우수한 성능 입증

추천 시스템 (Recommender systems)은 종종 관찰된 사용자-아이템 상호작용 데이터에 의존하는데, 이는 사용자의 선택적 상호작용으로 인해 선택 편향 (selection bias)이 발생하기 쉽습니다. 역 성향 가중치 (Inverse propensity weighting) 및 이중 강건 추정량 (doubly robust estimators)은 관찰된 혼란 변수 (observed confounding) 하에서 선택 편향을 효과적으로 완화하지만, 숨겨진 혼란 변수 (hidden confounders)가 존재하는 경우에는 신뢰할 수 없습니다. 무작위 대조 시험 (RCTs) 또는 전역 민감도 경계 (global sensitivity bounds)에 의존하는 기존 방식들은 실제 적용에 제약이 있습니다. RCT는 비용이 많이 드는 실험 데이터를 요구하며, 전역 민감도 경계는 민감도 분석 (sensitivity analysis)을 통해 측정되지 않은 혼란 변수가 성향 (propensities)에 미치는 영향이 균일하게 제한되어 있다고 가정함으로써 사용자-아이템 상호작용 간의 이질성 (heterogeneity)을 무시합니다. 이러한 한계를 극복하기 위해, 우리는 사용자-아이템 수준의 민감도 경계를 추정하여 전역 민감도 경계에 내재된 균일성 가정을 실질적으로 완화하는 새로운 프레임워크인 Personalized Unobserved-Confounding-aware Interaction Deconfounder (PUID)를 제안합니다. 강건성 (robustness)과 예측 정확도 (predictive accuracy)를 모두 보장하기 위해, 우리는 적대적 최적화 (adversarial optimization) 전략을 추가로 개발하였으며, 사전 학습된 모델을 안정화 참조점으로 통합하는 벤치마크 가이드 변형 모델 (BPUID)을 제안합니다. 세 개의 실제 데이터셋에 대한 광범위한 실험을 통해, 우리의 접근 방식이 RCT 데이터 없이도 숨겨진 혼란 변수 하에서 전역 방식 (global methods)보다 성능이 현저히 뛰어남을 입증하였습니다.

AI 자동 생성 콘텐츠

원문 바로가기

MNAR 상황에서 숨겨진 혼란 변수가 존재할 때의 강건한 개인화 추천

요약

핵심 포인트

댓글