본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 02. 19:12

Browser-CLI: 명령줄(Command Line)에서 AI 에이전트가 브라우저를 제어하게 하세요

요약

Browser-CLI는 Playwright를 Go 기반의 CLI로 래핑하여 AI 에이전트가 터미널에서 브라우저를 직접 제어할 수 있게 돕는 도구입니다. 별도의 코드 작성 없이 셸 명령어를 통해 클릭, 양식 채우기, 데이터 추출 등의 작업을 수행할 수 있습니다.

핵심 포인트

  • Playwright를 범용 CLI 인터페이스로 변환하여 AI 에이전트 활용성 극대화
  • Claude Code, OpenAI Codex, Cursor 등 다양한 AI 도구와 즉시 통합 가능
  • 세션 격리, 쿠키 지속성, 프록시 지원 등 강력한 브라우저 제어 기능 제공
  • 구조화된 JSON 출력과 AI 우선 설계를 통한 에이전트 친화적 설계

당신의 AI 코딩 어시스턴트가 실제로 브라우저를 사용하기를 원한 적이 있나요? 단순히 웹 페이지를 읽는 것을 넘어, 버튼을 클릭하고, 양식을 채우고, 스크린샷을 찍고, 데이터를 추출하는 모든 작업을 터미널(Terminal)에서 수행하는 것 말입니다.

그것이 바로 제가 Browser-CLI를 만든 이유입니다.

이것은 무엇인가요?

Browser-CLI는 Playwright를 래핑(Wrap)한 Go 기반의 명령줄 도구(Command-line tool)로, 간단한 셸(Shell) 명령어를 통해 AI 에이전트에게 완전한 브라우저 제어 권한을 부여합니다. API 키도, 브라우저 확장 프로그램도, 복잡한 설정도 필요 없습니다. 그저 명령어를 실행하기만 하면 됩니다.

# 설치
git clone https://github.com/zmysysz/browser-cli
cd browser-cli && make build && make install
...

왜 Playwright를 직접 사용하지 않나요?

Playwright는 훌륭하지만, 라이브러리(Library)입니다. 즉, 이를 사용하려면 코드를 작성해야 합니다. Browser-CLI는 이를 **범용 CLI 인터페이스 (Universal CLI interface)**로 변환하여, 어떤 AI 에이전트라도 자동화 코드를 단 한 줄도 작성하지 않고 호출할 수 있게 합니다.

이는 다음과 같은 의미를 갖습니다:

  • Claude Code가 웹을 탐색할 수 있습니다.
  • OpenAI Codex가 양식을 채우고 데이터를 추출할 수 있습니다.
  • Cursor가 스크린샷을 찍고 페이지와 상호작용할 수 있습니다.
  • 모든 AI 에이전트가 셸 명령어를 통해 브라우저 작업을 자동화할 수 있습니다.

주요 기능

  • 🤖 AI 우선 설계 (AI-First Design) — 구조화된 JSON 출력, 자동 관리되는 서버, 명확한 명령어 의미론(Semantics)
  • 🔒 세션 격리 (Session Isolation)--session을 통해 각 에이전트가 고유한 브라우저 인스턴스를 가집니다.
  • 🍪 쿠키 지속성 (Cookie Persistence) — 자동 저장/로드, 세션 간 로그인 상태 유지
  • 🌐 프록시 지원 (Proxy Support) — 제한된 네트워크를 위한 --proxy http://host:port 지원
  • 🎯 웹 컴포넌트 (Web Components) — 커스텀 요소 및 Shadow DOM을 위한 smart-clickpick 기능
  • ⌨️ 전체 키보드 지원 (Full Keyboard) — 단축키, 조합키, Tab/Enter/Escape, Ctrl+A/C/V
  • 📄 PDF 및 스크린샷 (PDF & Screenshot) — 페이지를 PDF 또는 PNG로 내보내기
  • 📁 파일 업로드 (File Upload) — 모든 <input type="file">에 파일 업로드

30가지 명령어 한눈에 보기

카테고리명령어
탐색 (Navigate)navigate, back, forward, reload
...

AI 도구와의 통합

Browser-CLI는 즉시 사용 가능한 통합 파일들을 함께 제공합니다:

파일도구사용 방법
integrations/claude/browser.mdClaude Code.claude/commands/로 복사
...

실전 예시 (Real-World Example)

AI 에이전트가 GitHub를 검색하고 결과를 추출하는 방법은 다음과 같습니다:

# GitHub로 이동
browser-cli navigate https://github.com/search?q=browser+automation

...

아키텍처 (Architecture)

Browser-CLI는 Unix 소켓 (Unix sockets)을 통한 클라이언트-서버 아키텍처 (client-server architecture)를 사용합니다:

AI 에이전트 → shell 명령 → browser-cli (클라이언트) → Unix 소켓 → 서버 → Playwright → 브라우저

서버는 첫 번째 명령 시 자동으로 시작되며 실행 상태를 유지합니다. 여러 에이전트가 격리된 세션 (isolated sessions)을 통해 동시에 연결될 수 있습니다.

CGO 불필요 (No CGO Required)

순수 Go 바이너리 (Pure Go binary)이며, CGO_ENABLED=0으로 컴파일됩니다:

# 정적 Linux 빌드
make build-static

...

시작하기 (Get Started)

git clone https://github.com/zmysysz/browser-cli
cd browser-cli && make build && make install
make setup-browsers
...

유용하다고 생각되시면 저장소에 별(Star) ⭐을 눌러주세요! 피드백과 기여를 환영합니다.

이 글은 AI 에이전트의 도움을 받아 초안이 작성되었습니다 — 하지만 도구 자체는 직접 손으로 만들어졌습니다. 😉

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0