arXiv논문2026. 05. 27. 12:19

더 많이 공유하고 더 적게 검색하기: 효율적인 Test-Time Scaling을 위한 협업적 병렬 사고 (Collaborative

요약

기존 병렬 Test-Time Scaling(TTS)의 정보 격리 문제를 해결하기 위해 훈련이 필요 없는 '협업적 병렬 사고(CPT)' 프레임워크를 제안합니다. CPT는 분기 간 중간 정보를 공유하여 중복 탐색을 줄이고 추론 효율성을 극대화합니다.

핵심 포인트

병렬 TTS 과정에서의 정보 격리로 인한 중복 탐색 문제 해결
훈련이 필요 없는(training-free) 협업적 병렬 사고(CPT) 프레임워크 제안
압축된 중간 정보 추출 및 쿼리 수준 정보 풀을 통한 정보 브로드캐스트
HMMT 및 AIME 벤치마크에서 우수한 정확도-지연 시간 파레토 프런티어 달성

Test-Time Scaling (TTS)는 솔루션 공간 (solution space)을 탐색하기 위해 추가적인 추론 연산 (inference compute)을 할당함으로써 대규모 언어 모델 (Large Language Models, LLMs)의 추론 능력을 향상시킵니다. 그러나 기존의 병렬 TTS 방법들은 일반적으로 검색 (search) 과정 동안 분기 (branches)들을 격리된 상태로 유지합니다. 즉, 중간 단계의 발견 사항들이 해당 분기에만 국한되어 다른 분기들을 적시에 가이드하지 못합니다. 이러한 정보 격리는 상당한 중복 탐색을 야기하는데, 각 분기가 이미 다른 곳에서 발견된 정보를 반복해서 재발견하게 만들고, 정답에 도달하는 데 필요한 완전한 결정 정보를 수집하기 위해 더 많은 검색 단계 (search steps)를 요구하기 때문입니다. 이러한 격차를 해소하기 위해, 우리는 병렬 분기 간의 검색 시간 정보 공유를 가능하게 하는 훈련이 필요 없는 (training-free) 추론 프레임워크인 extbf{협업적 병렬 사고 (Collaborative Parallel Thinking, CPT)}를 제안합니다. CPT는 진행 중인 분기들로부터 압축된 중간 정보를 추출하고, 중복이 제거된 쿼리 수준 (query-level) 정보 풀 (pool)을 유지하며, 입력 컨텍스트 (input context)를 통해 풀의 항목들을 브로드캐스트 (broadcast)합니다. 이를 통해 후속 검색 단계의 각 분기는 동일한 정보를 재발견하는 대신 다른 분기에서 이루어진 발견 사항을 재사용할 수 있습니다. 실증적으로, HMMT 및 AIME 벤치마크에 대한 실험 결과, CPT는 롤아웃 예산 (rollout budgets) 및 모델 규모 전반에 걸쳐 강력한 베이스라인 (baselines)보다 더 강력한 정확도-지연 시간 파레토 프런티어 (accuracy--latency Pareto frontier)를 구축함을 보여주었으며, 이는 검색 시간의 협업이 효율적인 병렬 TTS를 위한 효과적인 방향임을 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

더 많이 공유하고 더 적게 검색하기: 효율적인 Test-Time Scaling을 위한 협업적 병렬 사고 (Collaborative

요약

핵심 포인트

댓글