
Kuaishou, Hugging Face에 MobileForge 오픈 소스 공개
요약
Kuaishou가 어노테이션 없이 모바일 GUI 에이전트를 학습시키는 MobileForge를 오픈 소스로 공개했습니다. 또한 Qwen은 7개 도메인을 시뮬레이션할 수 있는 언어 세계 모델인 AgentWorld를 출시했습니다.
핵심 포인트
- MobileForge는 라벨 없이 AndroidWorld에서 77.6%의 Pass@3 달성
- MobileForge의 모델과 데이터셋은 Hugging Face를 통해 공개됨
- AgentWorld는 터미널, 웹 등 7개 도메인을 지원하는 언어 세계 모델
- AgentWorld는 256K 컨텍스트 윈도우와 35B 파라미터 규모를 가짐
Kuaishou가 Hugging Face에 MobileForge를 오픈 소스로 공개했습니다.
실제 앱 상호작용으로부터 모바일 GUI 에이전트 (GUI agents)를 적응시키는 어노테이션이 필요 없는 (annotation-free) 시스템입니다.
이 시스템이 적응시킨 에이전트는 사람이 작성한 작업이나 라벨 없이도 AndroidWorld에서 77.6%의 Pass@3를 달성했습니다.
모든 결과물은 Hugging Face에 있습니다.
프로젝트 페이지:
https://mobile-forge.github.io
논문:
https://paperswithcode.co/paper/2606.199
30
…
모델:
https://huggingface.co/collections/lgy0404/mobileforge-models
…
데이터셋:
https://huggingface.co/collections/lgy0404/mobileforge-datasets
…
Qwen이 방금 Hugging Face에 AgentWorld를 출시했습니다.
터미널 (terminal), 검색 (search), Android, 웹 (web) 등 7개 도메인에 걸쳐 에이전트를 시뮬레이션하기 위해 네이티브로 구축된 최초의 언어 세계 모델 (language world model)입니다.
이 모델은 256K 컨텍스트 윈도우 (context window)를 가지며, 총 35B / 활성 3B 파라미터 (parameters)로 구동됩니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기