
OpenThoughts-Agent
요약
OpenThoughts-Agent는 에이전트 모델을 위한 개방형 데이터 큐레이션 파이프라인을 제안합니다. Qwen3-32B를 활용해 벤치마크 성능을 대폭 향상시켰으며, MobileForge를 통해 라벨 없이도 모바일 GUI 에이전트를 학습시키는 기술을 공개했습니다.
핵심 포인트
- 100개 이상의 절제 연구를 통한 최적의 데이터 레시피 도출
- Qwen3-32B 기반 에이전트 성능을 7개 벤치마크에서 44.8%로 향상
- MobileForge를 통한 어노테이션 프리 모바일 GUI 에이전트 적응 기술
- AndroidWorld 벤치마크에서 77.6%의 Pass@3 달성
OpenThoughts-Agent
광범위한 능력을 갖춘 에이전트 모델 (agentic models)을 위한 완전 개방형 데이터 큐레이션 파이프라인 (data curation pipeline). 100개 이상의 절제 연구 (ablations)를 통해 최적의 레시피를 찾아냈습니다. 100K개의 학습 예시 (training examples)를 통해 Qwen3-32B를 7개 벤치마크 전반에서 44.8%까지 끌어올렸으며, 이는 이전의 최고 성능을 기록한 오픈 에이전트보다 3.9포인트 높은 수치입니다.
논문 (Paper):
https://paperswithcode.co/paper/2606.248
55
…
모델 및 데이터셋 (Models & datasets):
https://huggingface.co/open-thoughts
프로젝트 (Project):
https://openthoughts.ai
Kuaishou가 Hugging Face에 MobileForge를 오픈 소스로 공개했습니다.
실제 앱 상호작용으로부터 모바일 GUI 에이전트 (mobile GUI agents)를 적응시키는 어노테이션 프리 (annotation-free) 시스템입니다.
이 적응된 에이전트는 사람이 작성한 작업이나 라벨 없이도 AndroidWorld에서 77.6%의 Pass@3를 달성했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기