
LoopCoder-v2 출시
요약
LoopCoder-v2는 18T 토큰으로 학습된 7B 모델로, 단 2번의 루프만으로 SWE-bench Verified에서 64.4점을 기록하며 대형 모델을 능가합니다. 또한 VibeThinker-3B는 3B 파라미터로 AIME26 및 LeetCode에서 압도적인 추론 성능을 보여줍니다.
핵심 포인트
- LoopCoder-v2는 7B 규모로 30배 더 큰 모델보다 높은 성능 기록
- SWE-bench Verified에서 64.4점 달성 (2회 루프 기준)
- VibeThinker-3B는 3B 파라미터로 프런티어 추론 성능 구현
- 모델 및 코드는 Hugging Face와 GitHub에 공개됨
LoopCoder-v2가 출시되었습니다.
단 2번의 루프(loop)만으로 SWE-bench Verified에서 64.4점을 기록하며, 30배 더 큰 모델들을 능가하는 18T 토큰(tokens)으로 학습된 7B 모델입니다.
세 번째 루프를 추가하면 성능이 오히려 저하됩니다.
모델과 코드는 Hugging Face에 있습니다.
논문(Paper):
https://paperswithcode.co/paper/2606.18023
…
모델(Model):
https://huggingface.co/Multilingual-Multimodal-NLP/LoopCoder-V2
…
코드(Code):
https://github.com/CSJianYang/LoopCoder
…
VibeThinker-3B는 단 3B 파라미터(parameters)로 프런티어 추론(frontier reasoning)에 도달합니다.
AIME26에서 94.3점을, LeetCode에서 96.1%를 기록하며 수백 배 더 큰 플래그십(flagship) 모델들을 능가합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기