본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 27. 18:12

에이전트 루프(Agentic loops)를 위한 실행 전 비용 시뮬레이터 구축 — 13개 모델, API 호출 0회, 오프라인 작동

요약

에이전트 루프 실행 전 예상 비용을 시뮬레이션하는 도구인 LoopLens를 소개합니다. API 호출 없이 오프라인에서 작동하며, 다양한 컨텍스트 전략과 모델별 비용을 비교 분석할 수 있습니다.

핵심 포인트

  • 에이전트 반복 실행에 따른 누적 비용을 사전에 예측 가능
  • 13개 모델 및 다양한 컨텍스트 관리 전략(Sliding window 등) 지원
  • API 호출 없이 순수 수학적 모델로 작동하는 오프라인 시뮬레이터
  • 사후 관측 도구와 달리 실행 전 비용 최적화 지점 파악 가능

문제점

에이전트 루프(Agentic loops)는 청구서가 도착하기 전까지는 명확히 알 수 없는 방식으로 비용을 누적시킵니다.

Iteration 1: $0.19. Iteration 30: $2.48. 동일한 에이전트, 동일한 작업 — 모델은 매 턴마다 전체 컨텍스트(full context)를 다시 읽습니다. 20번째 반복(iteration)에 도달하면 동일한 컨텍스트에 대해 20번의 비용을 지불하게 됩니다.

내가 만든 것

LoopLens는 실행 전 비용 시뮬레이터(pre-run cost simulator)입니다. 루프를 실행하기 전에 설정을 구성하고 반복(per-iteration)별 상세 내역을 확인할 수 있습니다.

모델링 대상:

  • 4가지 컨텍스트 누적 전략 (full, sliding window, summarization, stateless)
  • 도구 호출 오버헤드 (web search, code execution, RAG, browser, external API)
  • 멀티 에이전트 팬아웃 (orchestrator + N subagents)
  • 프롬프트 캐싱 (Prompt caching) 손익분기점 분석
  • Anthropic, OpenAI, Google, DeepSeek에 걸친 13개 모델 — 나란히 비교

테스트 구성의 실제 수치

30 iterations · Claude Sonnet 4.6 · 4 parallel subagents · web search + code execution:

  • 총합: $39.96
  • DeepSeek V4 Flash에서 동일한 루프 실행 시: $1.85 (95% 절감)
  • 캐싱 손익분기점: 1회 실행 시, 월 $23.33 절약
  • Sliding window vs full accumulation: 85% 절감

아키텍처

순수 결정론적 수학(Pure deterministic math) — API 호출 0회, 완전히 오프라인에서 작동합니다. 가격 정보는 페이지 로드 시 LiteLLM 커뮤니티 가격 JSON에서 실시간으로 가져오며, 세션 캐시로 6시간 동안 유지되고, GitHub Actions를 통해 매주 업데이트되는 하드코딩된 폴백(fallback)이 제공됩니다. 상태 배지는 어떤 레이어가 활성화되어 있는지 보여줍니다.

차이점: 다른 모든 비용 도구(Langfuse, Helicone, Braintrust, Bifrost, W&B)는 사후 관측성(post-hoc observability) 도구입니다. LoopLens는 제가 알고 있는 유일한 실행 전 시뮬레이터입니다.

링크

Live: looplens-project.vercel.app
Source: github.com/Virerra/looplens
License: MIT






[
](https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.us-east-2.amazonaws.com%2Fuploads%2Farticles%2Fhp35aitlpb38t3divq8v.png

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0