arXiv논문2026. 06. 15. 11:21

대규모 언어 모델 기반 생성형 추천을 위한 암시적 추론 (Implicit Reasoning)

요약

LLM 기반 생성형 추천(GR)에서 시맨틱 ID 사용으로 인한 추론 방해 문제를 해결하기 위해 경량 암시적 추론 패러다임인 PauseRec을 제안합니다. PauseRec은 명시적 추론 과정 없이도 성능을 높이고 학습 비용과 추론 속도를 획기적으로 개선합니다.

핵심 포인트

시맨틱 ID와 자연어 토큰 간의 정렬 불량 문제 해결
명시적 CoT 방식 대비 성능 최대 6.22% 향상
학습 비용(GPU 시간) 최대 65% 절감
추론 속도 최대 71.3% 향상

대규모 언어 모델 (LLMs)은 사전 학습된 세상 지식에 접근할 수 있다는 장점을 바탕으로 생성형 추천 (Generative Recommendation, GR)의 백본 (backbone)으로 점점 더 많이 채택되고 있습니다. 그러나 GR을 위해 이 지식을 신뢰성 있게 호출하는 방식은 여전히 제대로 이해되지 않은 상태입니다. 주요 장애물은 LLM 기반 GR이 일반적으로 아이템을 시맨틱 ID (Semantic IDs, SIDs)로 표현한다는 점인데, 이는 이러한 토큰들이 사전 학습 과정에서 LLM에 의해 본 적 없는 것이기 때문에 LLM의 자연어 추론 인터페이스를 방해합니다. 기존 방식들은 SIDs를 접지(grounding)하고 명시적인 근거(rationales)를 이끌어내는 비용이 많이 드는 다단계 파이프라인을 통해 이를 해결하려 하지만, 각 단계가 언제 그리고 왜 필요한지에 대한 통찰은 제한적입니다. 본 연구에서는 LLM 기반 GR을 위한 명시적 추론 학습 파이프라인을 체계적으로 분해하여 세 가지 주요 한계를 밝혀냈습니다: 약화된 세상 지식의 언어화 (verbalization), SID와 자연어 토큰 임베딩 공간 간의 정렬 불량 (misalignment), 그리고 근거 품질에 대한 민감성입니다. 이 모든 요소는 명시적 추론 성능을 저하시킵니다. 이러한 문제들을 우회하기 위해, 우리는 GR에 맞춤화된 경량 암시적 추론 패러다임인 PauseRec을 제안합니다. PauseRec은 비용이 많이 드는 추론 흔적(reasoning trace) 획득 및 추론 정렬 학습을 피함으로써 매우 실용적이며, 다음과 같은 수많은 이점을 제공합니다: (1) 표준적인 명시적 사고 사슬 (Chain-of-Thought, CoT) 방식보다 최대 6.22% 더 높은 성능을 보이며, (2) 학습 비용을 GPU 시간 기준 최대 65%까지 절감하고, (3) 추론 속도를 최대 71.3%까지 향상시킵니다. 이러한 결과는 PauseRec을 명시적 근거 생성의 경량 대안으로 자리매김하게 하며, 더욱 효과적이고 효율적인 LLM 기반 GR을 가능하게 합니다.

AI 자동 생성 콘텐츠

원문 바로가기

대규모 언어 모델 기반 생성형 추천을 위한 암시적 추론 (Implicit Reasoning)

요약

핵심 포인트

댓글