Magnitude: WebVoyager에서 94% 점수를 기록한 최신 브라우저 에이전트
요약
Magnitude는 Vision AI를 활용하여 자연어 기반으로 브라우저를 제어하는 최신 에이전트입니다. 웹 탐색, 상호작용, 데이터 추출 등 다양한 기능을 제공하며, API 없이 앱 간 통합이나 웹 테스트 자동화에 사용될 수 있습니다. 특히 시각적으로 근거 있는(visually grounded) 아키텍처로 일반화 문제를 해결했습니다.
핵심 포인트
- 자연어 기반으로 브라우저를 제어하는 에이전트입니다.
- 시각적 단언 및 내장 테스트 러너를 제공합니다.
- Vision-first 아키텍처로 높은 일반성을 확보했습니다.
- Claude Sonnet 4 등 대규모 VL 모델을 권장합니다.
🚀 신규 기능: Magnitude는 state-of-the-art 성능을 보여주며, WebVoyager에서 94%의 점수를 기록했습니다!
Magnitude는 Vision AI를 사용하여 자연어(natural language)로 브라우저를 제어할 수 있게 합니다.
- 🧭 탐색 (Navigate) - 모든 인터페이스를 보고 이해하여 행동을 계획합니다. - 🖱️
상호작용 (Interact) - 마우스와 키보드를 사용하여 정밀한 행동을 실행합니다. - 🔍
추출 (Extract) - 유용한 구조화된 데이터를 지능적으로 추출합니다. - ✅
검증 (Verify) - 강력한 시각적 단언(visual assertions) 기능을 갖춘 내장 테스트 러너를 제공합니다.
이것을 사용하여 웹에서 작업을 자동화하거나, API 없이 앱 간 통합을 하거나, 데이터를 추출하거나, 웹 앱을 테스트하거나, 또는 자체 브라우저 에이전트의 빌딩 블록으로 사용할 수 있습니다.
// Magnitude는 높은 수준의 작업(high-level tasks)을 처리할 수 있습니다.
await agent.act('Create a task', { // 적절한 곳에 에이전트가 사용할 데이터를 선택적으로 전달합니다.
...
npx create-magnitude-app
이 명령어는 새 프로젝트를 생성하고 Magnitude 설정 단계를 안내할 것입니다. 또한 바로 실행해 볼 수 있는 예제 스크립트도 생성합니다!
기존(existing) 웹 앱에서 테스트 러너를 설치하려면 다음을 실행하십시오:
npm i --save-dev magnitude-test && npx magnitude init
이 명령어는 다음과 같은 파일들이 포함된 기본적인 tests/magnitude 디렉토리를 생성합니다:
magnitude.config.ts : Magnitude 테스트 설정 파일
example.mag.ts : 예제 테스트 파일
테스트 실행 방법 및 CI/CD 통합에 대한 정보는 여기를 참조하십시오.
참고
Magnitude는 대규모의 시각적으로 근거 있는(visually grounded) 모델을 필요로 합니다. 최고의 성능을 위해서는 Claude Sonnet 4를 권장하지만, Qwen-2.5VL 72B와도 호환됩니다. 자세한 정보는 문서를 참조하십시오.
❌ 문제점 #1: 대부분의 브라우저 에이전트는 페이지 요소 주변에 번호가 매겨진 상자를 그립니다. 이는 복잡한 현대 웹사이트에서는 일반화하기 어렵습니다.
✅ 해결책: Vision-first 아키텍처
- 시각적으로 근거 있는 LLM은 픽셀 좌표를 지정합니다.
- DOM 구조와 무관하게 진정한 일반화를 달성합니다.
- 데스크톱 앱, VM 등 미래 지향적인 아키텍처입니다.
❌ 문제점 #2: 대부분의 브라우저 에이전트는
✅ 해결책: 제어 가능하고 반복 가능한 자동화 (Controllable & repeatable automation)
- 유연한 추상화 수준 (세밀한 액션 vs. 흐름)
- 에이전트 및 액션 레벨에서의 사용자 지정 액션 + 프롬프트
- 네이티브 캐싱 시스템을 통한 결정론적 실행 (Deterministic runs via native caching system)
(진행 중)
Magnitude 자동화 및 테스트 케이스를 가장 잘 구축하고 테스트하는 방법에 대한 자세한 내용은 문서를 참고해 주세요.
만약 귀사가 기업(enterprise)이고 더 많은 기능이나 지원을 원한다면, founders@magnitude.run으로 연락하거나 여기에서 통화를 예약하여 필요한 사항에 대해 논의할 수 있습니다.
도움이 필요하거나 제안 사항이 있다면 저희 Discord 커뮤니티에 참여하실 수도 있습니다!
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub AI Tools의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기