X요약2026. 05. 19. 23:40

Browserbase가 「Browse.sh」를 공개!!! Browse.sh는 AI 에이전트가 웹사이트에서 작업하기 위한 오픈 소스 스킬

요약

Browserbase가 AI 에이전트가 웹사이트에서 안정적으로 작업을 수행할 수 있도록 돕는 오픈 소스 스킬 카탈로그인 「Browse.sh」를 공개했습니다. 이 도구는 사이트별 UI 차이, 로그인 흐름, 동적 페이지 로딩 등 AI가 웹 조작 시 겪는 현실적인 문제들을 해결하기 위해 수백 개의 사이트에 대한 조작 절차(Playbook)를 제공합니다.

핵심 포인트

AI 에이전트가 웹사이트에서 클릭, 로그인, 폼 입력 등을 수행할 수 있는 오픈 소스 스킬 카탈로그 제공
웹사이트마다 다른 UI와 동적 로딩 문제를 해결하기 위해 사이트별 맞춤형 플레이북 활용
AI 에이전트의 실무 적용을 위해 모델 성능만큼이나 정교한 실무용 절차 데이터가 중요함을 시사

Browserbase가 「Browse.sh」를 공개!!!

Browse.sh는 AI 에이전트가 웹사이트 상에서 작업하기 위한 오픈 소스 (Open-source) 스킬 카탈로그입니다.

・이 사이트에서 어디를 클릭할 것인가
・로그인 후 무엇을 확인할 것인가
・폼 (Form)을 어떻게 입력할 것인가
・동적으로 변하는 페이지에서 무엇을 기다릴 것인가
・목적하는 조작을 어떻게 완료할 것인가

와 같은, 사이트별 작업 절차를 정리한 것입니다.

Browserbase는 수백 개의 사이트를 조사하여, AI 에이전트가 웹을 조작하기 위한 플레이북 (Playbook)을 준비했다고 합니다.

이것이 중요한 이유는, 웹 조작 AI가 실패하기 쉬운 이유가 상당히 현실적이기 때문입니다.

웹사이트마다 UI가 다르다.
로그인 흐름도 다르다.
버튼 이름도 폼 (Form) 구조도 다르다.
페이지가 나중에 로드되는 경우도 있다.

그때마다 AI가 더듬거리며 조작하면, 클릭 실수, 입력 실수, 중간 정지가 일어나기 쉽습니다.

사이트별 스킬이나 절차가 있다면, AI 에이전트는 매번 제로 베이스에서 헤매지 않고, 정해진 흐름에 따라 작업할 수 있습니다.

즉,
Browse.sh는 AI에게 웹 작업을 맡기기 위한 「사이트별 조작 절차집」입니다.

AI 에이전트가 정말로 업무에서 사용되려면, 모델 성능뿐만 아니라, 이러한 실무용 절차 데이터가 상당히 중요해집니다.

이것은 엄청나네요...

Karachi의 개발자가 「LLM을 처음부터 만드는 방법」을 하나의 Jupyter notebook에 정리하여 무료로 공개하고 있습니다.

이름은 「Train LLM From Scratch」입니다.

GPT-4 품질의 모델을 재현하는 것은 아닙니다.

AI 자동 생성 콘텐츠

원문 바로가기

Browserbase가 「Browse.sh」를 공개!!! Browse.sh는 AI 에이전트가 웹사이트에서 작업하기 위한 오픈 소스 스킬

요약

핵심 포인트

댓글