본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 09. 07:05

Qwen/WebWorld 32B/14B/8B (Qwen3 finetune)

요약

WebWorld는 웹 에이전트 훈련 및 평가를 위해 설계된 대규모 오픈웹 월드 모델 시리즈입니다. 이 모델은 100만 개 이상의 실제 웹 상호작용 궤적을 학습했으며, 장기 시뮬레이션, 다양한 상태 표현(HTML, XML 등), 그리고 CoT 활성화 추론 기능을 지원합니다. WebWorld로 학습된 에이전트는 MiniWob++ 및 WebArena와 같은 벤치마크에서 높은 성능 향상을 보이며, 월드 모델로서 GPT-5를 능가하는 잠재력을 보여줍니다.

핵심 포인트

  • WebWorld는 웹 상호작용에 특화된 대규모 오픈웹 월드 모델입니다.
  • 1M+의 실제 웹 궤적 데이터로 학습되어 현실적인 에이전트 행동을 모방합니다.
  • 장기 지평 시뮬레이션(30단계 이상)과 다양한 형식의 상태 표현 능력을 갖추고 있습니다.
  • MiniWob++ 및 WebArena 등 주요 웹 에이전트 벤치마크에서 높은 성능 향상을 입증했습니다.

WebWorld 는 웹 에이전트 훈련 및 평가용 대규모 오픈웹 월드 모델 시리즈입니다. 확장 가능한 계층적 데이터 파이프라인을 통해 **실제 세계 웹 상호작용 궤적 1M+**로 학습되며, 다음 기능을 지원합니다:

  • 장기 지평 시뮬레이션 (30+ 단계)
  • 다양한 형식의 상태 표현: A11y Tree, HTML, XML, Markdown 및 자연어
  • 전이 예측을 위한 CoT 활성화 추론
  • 코드, GUI, 게임 환경으로의 도메인 간 일반화

WebWorld 로 생성된 궤적에서 학습된 에이전트는 **MiniWob++ 에서 +9.9%**와 **WebArena 에서 +10.9%**를 달성합니다. 추론 시간 시선 검색에 사용될 경우, WebWorld 는 월드 모델로서 GPT-5 를 능가합니다.

https://huggingface.co/Qwen/WebWorld-32B

https://huggingface.co/Qwen/WebWorld-14B

https://huggingface.co/Qwen/WebWorld-8B

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0