Browser Use가 또 사고를 쳤습니다, 여러분! 이제 당신의 Agent에게 '눈'을 달아줄 차례입니다!
요약
Browser Use가 에이전트가 실제 클라우드 브라우저를 사용하고 실시간으로 작동 과정을 시각화할 수 있는 오픈 소스 템플릿 'B'를 공개했습니다. Vercel의 Eve를 기반으로 구축되었으며, 에이전트의 웹 탐색, 클릭, 양식 작성을 실시간으로 관찰하고 디버깅할 수 있습니다.
핵심 포인트
- 오픈 소스 브라우저 에이전트 템플릿 'B' 공개
- 실제 클라우드 브라우저 연결을 통한 실시간 시각화 지원
- 에이전트의 웹 상호작용 과정 디버깅 용이성 확보
- GitHub를 통한 즉시 사용 및 MCPs 초기화 지원
이 녀석 Browser Use가 또 사고를 쳤습니다, 여러분!
이제 정말로 당신의 "Agent에게 눈을 달아준 셈입니다!"
오픈 소스이며 무료입니다 🆓
그들은 브라우저 Agent 템플릿 B를 직접 오픈 소스로 공개하여, 어떤 Agent라도 실제 클라우드 브라우저를 사용할 수 있게 했으며, 웹 페이지에서 작동하는 모습을 실시간으로 볼 수 있게 했습니다.
이 템플릿의 이름은 B이며, Vercel의 Eve를 기반으로 구축되었습니다.
당신의 Agent에 Browser Use Cloud browser를 연결하면, Agent가 실제로 인터넷을 탐색하고, 클릭하고, 양식을 작성할 수 있게 되며, browser-harness를 통해 전체 과정을 실시간으로 볼 수 있습니다.
GitHub에서 직접 clone하여 바로 사용할 수 있으며, skills와 MCPs의 초기화도 지원합니다.
이전에 브라우저 Agent를 만들 때 가장 번거로웠던 점은 다음과 같습니다: 시뮬레이션 환경을 사용하여 실제 상호작용을 볼 수 없거나, 블랙박스(Black box) 방식으로 실행되어 어디서 문제가 발생했는지 알 수 없다는 것이었습니다.
이제 이 템플릿이 생기면서, Agent가 웹 페이지에서 수행하는 모든 단계가 시각화되고 디버깅(Debugging)이 가능해졌으며, 실제 클라우드 브라우저에 직접 연결할 수도 있습니다.
이는 사실 브라우저 자동화(Browser automation)를 "사용 가능한" 단계에서 "진정으로 사용하기 좋은" 단계로 끌어올린 것입니다.
Agent는 더 이상 코드 안에서만 웹 페이지를 시뮬레이션하는 것이 아니라, 이제 실제 웹 페이지 환경에서 작업을 수행할 수 있으며, 인간이 실시간으로 관찰하고 개입할 수도 있습니다.
가장 중요한 점은 템플릿을 오픈 소스로 공개했다는 것이며, 누구나 이를 기반으로 자신만의 브라우저 Agent를 빠르게 구축할 수 있습니다.
미래에는 점점 더 많은 Agent가 순수 텍스트 상호작용이 아닌, "볼 수 있는" 브라우저를 기본적으로 탑재하게 될 것입니다.
지금의 오픈 소스 생태계는 정말 좋네요 😆
AI 자동 생성 콘텐츠
본 콘텐츠는 X @berryxia (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기