본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 07. 01:58

JetBrains, Mellum2 오픈 소스로 공개

요약

JetBrains가 12B MoE 모델인 Mellum2를 오픈 소스로 공개했습니다. 2.5B의 활성 파라미터만 사용하여 코드 생성, 추론, 에이전트 워크플로에 최적화된 성능을 제공합니다.

핵심 포인트

  • 12B MoE 구조로 설계된 효율적인 모델
  • 2.5B 활성 파라미터로 14B 모델급 성능 구현
  • 코드 생성 및 에이전트 워크플로 최적화
  • Hugging Face를 통해 체크포인트 공개

JetBrains가 Mellum2를 오픈 소스로 공개했습니다.

토큰당 단 2.5B의 활성 파라미터 (active parameters)만으로 처음부터 학습된 12B Mixture-of-Experts (MoE) 모델입니다.
코드, 추론 (reasoning), 그리고 빠른 에이전트 워크플로 (agentic workflows)를 위해 구축되었습니다.
2.5B의 밀집 연산 (dense compute)으로 구동되면서도 14B 모델들과 경쟁할 만한 성능을 보여줍니다.

모든 체크포인트 (checkpoints)는 Hugging Face에 있습니다.

논문 (Paper):
https://huggingface.co/papers/2605.31
268

컬렉션 (Collection):
https://huggingface.co/collections/JetBrains/mellum-2

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0