X요약2026. 06. 24. 23:50

Qwen-AgentWorld가 ModelScope에 두 가지 릴리스를 공개했습니다! 256K 컨텍스트를 지원하는 오픈 35B 전체 / 3B

요약

Qwen-AgentWorld가 256K 컨텍스트를 지원하는 35B 및 3B MoE 월드 모델을 ModelScope에 공개했습니다. 이 모델은 7가지 에이전트 환경을 지원하며, AgentWorldBench에서 Claude Sonnet 4.6을 능가하는 성능을 보여주었습니다.

핵심 포인트

256K 컨텍스트를 지원하는 35B 및 3B MoE 모델 출시
MCP, Search, Terminal 등 7개 도메인 에이전트 환경 지원
AgentWorldBench에서 Claude Sonnet 4.6보다 높은 성능 기록
CPT, SFT, RL을 활용한 3단계 학습 프로세스 적용

Qwen-AgentWorld가 ModelScope에 두 가지 릴리스를 공개했습니다! 256K 컨텍스트를 지원하는 오픈 35B 전체 / 3B 활성 MoE (Mixture-of-Experts) 월드 모델과 실제 환경 관찰에 기반한 7개 도메인 벤치마크를 포함합니다. 🚀
🔗 https://t.co/Cv7pJCiM8s

Qwen-AgentWorld-35B-A3B
🌍 7가지 에이전트 환경을 위한 하나의 모델: MCP, Search, Terminal, SWE, Web, OS, 그리고 Android
🧪 AgentWorldBench에서 47.73 → 56.39를 기록하며, 56.04를 기록한 Claude Sonnet 4.6을 능가함
🧠 3단계 학습: CPT는 환경 지식을 주입하고, SFT는 다음 상태 예측 (next-state prediction) 추론을 활성화하며, RL은 시뮬레이션 충실도 (simulation fidelity)를 정교화함

AgentWorldBench
🛠️ 2,170개의 샘플과 평균 22.8회의 턴(turns)으로 7개 도메인을 다룸
🔎 형식(format), 사실성(factuality), 일관성(consistency), 현실성(realism), 그리고 품질(quality) 측면에서 예측 점수를 산출

AI 자동 생성 콘텐츠

원문 바로가기

Qwen-AgentWorld가 ModelScope에 두 가지 릴리스를 공개했습니다! 256K 컨텍스트를 지원하는 오픈 35B 전체 / 3B

요약

핵심 포인트

댓글