본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 31. 22:32

agent-gov 발표: 오픈 소스 AI 에이전트 비용 거버넌스 (Cost Governance)

요약

AI 에이전트의 무분별한 API 호출로 인한 비용 폭증 문제를 해결하기 위한 오픈 소스 비용 거버넌스 플랫폼 agent-gov를 소개합니다. 리버스 프록시 방식으로 작동하여 실시간 비용 추적, 일일 예산 강제, 예산 초과 시 에이전트 자동 중단 기능을 제공합니다.

핵심 포인트

  • 에이전트의 자율적 루프 발생 시 발생하는 비용 폭증 방지
  • OpenAI 호환 클라이언트를 위한 경량 리버스 프록시 미들웨어
  • 실시간 토큰 비용 조회 및 일일 예산 초과 시 자동 호출 차단
  • SQLite 기반의 모든 사용량 및 비용 감사 추적 기능

agent-gov 발표: 오픈 소스 AI 에이전트 비용 거버넌스 (Cost Governance)

AI 에이전트가 청구한 예상치 못한 500달러짜리 고지서 때문에 잠에서 깨는 일을 멈추세요.

새벽 3시의 경고

화요일 새벽 3시 47분이었습니다. 휴대폰이 울렸습니다 — Cloudflare 청구 알림이었습니다. 그다음 또 하나. 그다음은 Stripe였습니다. 제가 노트북으로 비틀거리며 달려갔을 때, 세 개의 서로 다른 제공업체가 단 6시간 만에 합계 487달러를 청구한 상태였습니다.

무슨 일이 일어난 걸까요? 단 하나의 AI 코딩 에이전트가 루프(loop)에 빠져 있었습니다. 동일한 버그를 반복해서 분석하고, 동일한 고가의 LLM 엔드포인트(endpoint)를 계속해서 호출하며, 하위 에이전트(sub-agents)를 생성하고, 그 하위 에이전트들이 또 다른 하위 에이전트를 생성하고 있었습니다. 아무도 그 에이전트에 제어 장치(governor)를 달아두지 않았습니다. 아무도 그럴 필요가 있다고 생각하지 않았습니다.

만약 여러분이 AI 에이전트로 무엇인가를 구축했다면 — 자동 PR 리뷰어, 고객 지원 봇, 코드 생성(code-gen) 파이프라인, 웹 조사 어시스턴트 등 — 여러분은 이미 이런 악몽을 경험했거나, 혹은 단 한 번의 수면 주기만 지나면 이 상황을 맞이하게 될 것입니다. 근본적인 문제는 간단합니다: 에이전트는 주니어 개발자가 코드를 작성하는 방식과 똑같이 돈을 씁니다 — 열정적으로, 자율적으로, 그리고 허락을 구하지 않고 말이죠.

대부분의 팀은 스프레드시트와 요행에 의존해 이 문제를 해결합니다. 어떤 팀은 첫 번째 폭발이 일어난 후에야 클라우드 예산 알림을 덧붙입니다. 몇몇은 에이전트를 사용하는 것 자체를 포기하기도 합니다.

우리는 진짜 해답을 원했습니다.

agent-gov의 등장

오늘 저는 AI 에이전트를 위해 특별히 제작된 오픈 소스, MIT 라이선스 비용 거버넌스(cost governance) 플랫폼인 agent-gov를 출시합니다. 이것은 에이전트와 LLM 제공업체 _사이_에 위치하는 경량 리버스 프록시(reverse proxy)로, 모든 비용을 추적하고, 일일 예산을 강제하며, **예산을 초과하여 사용하는 에이전트를 자동으로 일시 중지(auto-pausing)**합니다.

pip install agent-gov-saas
agent-gov start

그게 전부입니다. 제로 상태에서 거버넌스 구축까지 단 30초면 충분합니다.

작동 방식

Agent-gov는 여러분의 에이전트에게 투명하게 작동합니다. 에이전트가 API를 직접 호출하는 대신 로컬 프록시 엔드포인트(local proxy endpoint)를 가리키도록 설정하면, agent-gov가 나머지를 처리합니다:

  1. 가로채기 (Intercept) — 모든 모델 호출이 agent-gov의 FastAPI 프록시를 통해 라우팅됩니다.
  2. 실제 비용 조회 (Look up real costs) — 내장된 도구 레지스트리 (tool registry)가 수백 개의 모델에 대한 정확한 토큰당 가격을 알고 있습니다.
  3. 예산 강제 (Enforce budgets) — 에이전트가 일일 할당량을 초과하면, agent-gov가 호출을 차단합니다.
  4. 모든 데이터 영속화 (Persist everything) — 모든 사용량은 aiosqlite를 통해 SQLite에 기록됩니다.

종속성 없음 (No lock-in). 클라우드 의존성 없음 (No cloud dependency). 사용자당 라이선스 비용 없음 (No per-seat licensing).

v0.5 기능

  • 리버스 프록시 미들웨어 (Reverse proxy middleware) — 모든 OpenAI 호환 클라이언트에 즉시 적용 가능
  • SQLite 영속화 (SQLite persistence) — 모든 호출, 토큰, 비용에 대한 완전한 감사 추적 (audit trail)
  • 실제 비용 테이블을 포함한 도구 레지스트리 (Tool registry with real cost tables) — 모델, 제공업체, 입력/출력 토큰 비율별 가격 책정
  • 자동 리셋 기능이 포함된 일일 예산 (Daily budgets with auto-reset) — 에이전트별, 워크스페이스별 또는 전역적으로 설정 가능
  • 예산 초과 시 자동 일시 중지 (Auto-pause on over-budget) — 에이전트가 구조화된 정책 차단을 받음
  • 멀티 테넌트 워크스페이스 (Multi-tenant workspaces) — 팀 또는 프로젝트별로 비용 격리
  • Docker 지원 (Docker support)docker compose up 명령으로 실행
  • 45개의 테스트, 0.3초 (45 tests, 0.3 seconds) — 견고하고 빠르며 잘 테스트된 코드베이스

퀵스타트 (Quickstart)

pip install agent-gov-saas
agent-gov start

일일 예산을 $5로 설정하기:

agent-gov config set budget 5.00 --agent code-review-bot

우리가 이것을 만든 이유

AI 에이전트 생태계가 폭발적으로 성장하고 있습니다. 하지만 그 주변의 운영적 성숙도는 2009년의 웹 앱 수준에 머물러 있습니다. 아직 아무도 가드레일 (guardrails)을 구축하지 않았기 때문에, 우리 모두는 가드레일 없이 에이전트를 실행하고 있습니다.

agent-gov는 여러분의 에이전트 인프라를 위한 **회로 차단기 (circuit breaker)**입니다. 단 하나의 폭주하는 루프가 일주일 치의 GPU 크레딧을 낭비하는 것을 방지해 주는 장치입니다.

비용 거버넌스 (cost governance)는 진입 장벽 (moat)이 아니라 기본 요건 (table stakes)이기 때문에, 이 프로젝트는 MIT 라이선스로 제공됩니다.

참여하기

비용 거버넌스가 필요하다는 사실을 새벽 3시에 깨닫지 마세요.

FastAPI, SQLite, 그리고 예상치 못한 청구서에 대한 건강한 공포심으로 제작되었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0