AIME 2026에서 94.3점을 기록한 3B 모델 - VibeThinker-3B - Insights | Molayo

Weibo AI가 방금 VibeThinker-3B를 출시했습니다. 이 모델의 벤치마크 수치는 스마트폰에서 로컬로 실행할 수 있을 만큼 작은 모델임에도 불구하고 매우 놀랍습니다. 이는 수학 및 코딩과 같은 엄격한 도메인에서는 초최적화된 학습 파이프라인 (hyper-optimized training pipeline)이 거대한 파라미터 규모 (parameter scale)와 경쟁할 수 있음을 증명합니다.

통계:

AIME26: 94.3 (자체 테스트 시간 스케일링 (test-time scaling) 적용 시 97.1로 상승). 이는 DeepSeek V3.2 (671B) 및 Kimi K2.5 (1T)와 맞먹는 수준입니다.
코딩 (Coding): LiveCodeBench v6에서 80.2 Pass@1을 기록했으며, 최근 공개되지 않은 LeetCode 컨테스트에서 96.1%의 통과율을 보였습니다.

링크:

논문 (Paper): https://arxiv.org/abs/2606.16140
가중치 (Weights): https://huggingface.co/WeiboAI/VibeThinker-3B
submitted by /u/DigiDecode_
[link] [comments]

Insights

AIME 2026에서 94.3점을 기록한 3B 모델 - VibeThinker-3B

요약

핵심 포인트

댓글

Microsoft 실적 발표의 3가지 주요 시사점

화물 시장 업데이트: 공급 능력이 부족한 5가지 신호

연방준비제도(Fed)가 56년 만에 전례 없는 조치를 취했습니다 — 이는 주식 시장에 중대한 시사점을 갖습니다

분석: 대형 투자자들은 한국 시장이 매수 적기라고 생각할 수도 있다

Microsoft 실적 발표의 3가지 주요 시사점

화물 시장 업데이트: 공급 능력이 부족한 5가지 신호

연방준비제도(Fed)가 56년 만에 전례 없는 조치를 취했습니다 — 이는 주식 시장에 중대한 시사점을 갖습니다

분석: 대형 투자자들은 한국 시장이 매수 적기라고 생각할 수도 있다