본문으로 건너뛰기

© 2026 Molayo

r/LocalLLaMA분석2026. 06. 16. 23:03

AIME 2026에서 94.3점을 기록한 3B 모델 - VibeThinker-3B

요약

Weibo AI가 출시한 VibeThinker-3B는 소규모 모델임에도 불구하고 AIME 2026에서 94.3점을 기록하며 거대 모델과 대등한 성능을 보였습니다. 초최적화된 학습 파이프라인을 통해 수학과 코딩 분야에서 압도적인 벤치마크 수치를 증명했습니다.

핵심 포인트

  • 3B 규모의 소형 모델로 AIME 2026에서 94.3점 기록
  • 테스트 시간 스케일링 적용 시 AIME 점수 97.1점까지 상승
  • DeepSeek V3.2 및 Kimi K2.5와 맞먹는 수학/코딩 성능
  • 초최적화된 학습 파이프라인의 효율성 입증

Weibo AI가 방금 VibeThinker-3B를 출시했습니다. 이 모델의 벤치마크 수치는 스마트폰에서 로컬로 실행할 수 있을 만큼 작은 모델임에도 불구하고 매우 놀랍습니다. 이는 수학 및 코딩과 같은 엄격한 도메인에서는 초최적화된 학습 파이프라인 (hyper-optimized training pipeline)이 거대한 파라미터 규모 (parameter scale)와 경쟁할 수 있음을 증명합니다.

통계:

  • AIME26: 94.3 (자체 테스트 시간 스케일링 (test-time scaling) 적용 시 97.1로 상승). 이는 DeepSeek V3.2 (671B) 및 Kimi K2.5 (1T)와 맞먹는 수준입니다.
  • 코딩 (Coding): LiveCodeBench v6에서 80.2 Pass@1을 기록했으며, 최근 공개되지 않은 LeetCode 컨테스트에서 96.1%의 통과율을 보였습니다.

링크:

AI 자동 생성 콘텐츠

본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0