Qwen/WebWorld 32B/14B/8B (Qwen3 finetune)
요약
WebWorld는 웹 에이전트 훈련 및 평가를 위해 설계된 대규모 오픈웹 월드 모델 시리즈입니다. 이 모델은 100만 개 이상의 실제 웹 상호작용 궤적을 학습했으며, 장기 시뮬레이션, 다양한 상태 표현(HTML, XML 등), 그리고 CoT 활성화 추론 기능을 지원합니다. WebWorld로 학습된 에이전트는 MiniWob++ 및 WebArena와 같은 벤치마크에서 높은 성능 향상을 보이며, 월드 모델로서 GPT-5를 능가하는 잠재력을 보여줍니다.
핵심 포인트
- WebWorld는 웹 상호작용에 특화된 대규모 오픈웹 월드 모델입니다.
- 1M+의 실제 웹 궤적 데이터로 학습되어 현실적인 에이전트 행동을 모방합니다.
- 장기 지평 시뮬레이션(30단계 이상)과 다양한 형식의 상태 표현 능력을 갖추고 있습니다.
- MiniWob++ 및 WebArena 등 주요 웹 에이전트 벤치마크에서 높은 성능 향상을 입증했습니다.
WebWorld 는 웹 에이전트 훈련 및 평가용 대규모 오픈웹 월드 모델 시리즈입니다. 확장 가능한 계층적 데이터 파이프라인을 통해 **실제 세계 웹 상호작용 궤적 1M+**로 학습되며, 다음 기능을 지원합니다:
- 장기 지평 시뮬레이션 (30+ 단계)
- 다양한 형식의 상태 표현: A11y Tree, HTML, XML, Markdown 및 자연어
- 전이 예측을 위한 CoT 활성화 추론
- 코드, GUI, 게임 환경으로의 도메인 간 일반화
WebWorld 로 생성된 궤적에서 학습된 에이전트는 **MiniWob++ 에서 +9.9%**와 **WebArena 에서 +10.9%**를 달성합니다. 추론 시간 시선 검색에 사용될 경우, WebWorld 는 월드 모델로서 GPT-5 를 능가합니다.
https://huggingface.co/Qwen/WebWorld-32B
AI 자동 생성 콘텐츠
본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기