
LongCat-2.0 오픈 소스 공개: 에이전트 기반 코딩을 위해 구축된 1.6T 총 파라미터 / 약 48B 활성 MoE 및 네이티브 1M
요약
에이전트 기반 코딩에 최적화된 오픈 소스 모델 LongCat-2.0이 공개되었습니다. 1.6T 총 파라미터와 1M 컨텍스트를 지원하며, 주요 코딩 벤치마크에서 최신 유료 모델들을 상회하는 성능을 보여줍니다.
핵심 포인트
- 1.6T 총 파라미터 및 48B 활성 MoE 구조 채택
- SWE-bench Pro 등 주요 코딩 벤치마크에서 업계 최고 수준 기록
- LongCat Sparse Attention을 통한 1M 네이티브 컨텍스트 지원
- MOPD 기술을 통한 에이전트 네이티브 기능(도구 사용, 자기 수정) 강화
LongCat-2.0이 이제 오픈 소스(open source)로 공개되었습니다. 이번 모델은 규모가 매우 큽니다: 에이전트 기반 코딩(agentic coding)을 위해 구축되었으며, 1.6T 총 파라미터 / 약 48B 활성 MoE(Mixture of Experts)를 갖추고, 네이티브 1M 컨텍스트를 지원합니다. 🚀
🤖https://t.co/EttbLqB8kU
🏆 코딩(Coding): SWE-bench Pro에서 59.5를 기록하며 Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.6을 앞질렀습니다. 또한 Terminal-Bench 2.1에서 70.8, SWE-bench Multilingual에서 77.3을 기록했습니다.
🧠 1M 컨텍스트: LongCat Sparse Attention은 선형 스케일링 희소 주의 집중(linear-scaling sparse attention)을 통해 긴 프로젝트 컨텍스트를 사용 가능한 상태로 유지합니다.
⚙️ 효율적인 MoE: ScMoE + zero-compute 전문가(experts)가 토큰당 약 33B에서 56B의 파라미터를 동적으로 활성화합니다.
🛠️ 에이전트 네이티브(Agent-native): MOPD는 도구 사용(tool use), 자기 수정(self-correction), STEM 추론 및 지시 이행(instruction following)을 위해 에이전트(Agent), 추론(Reasoning), 상호작용(Interaction) 전문가 그룹 간을 라우팅합니다.
35T 이상의 토큰으로 처음부터 사전 학습(Pretrained from scratch)되었으며, GPU 및 NPU 배포를 모두 지원합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: Claude/Anthropic의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기