본문으로 건너뛰기

© 2026 Molayo

r/ClaudeAI분석2026. 06. 15. 08:44

여러 개의 Claude Code 에이전트를 동시에 실행할 때 비용은 블랙박스와 같았습니다. 그래서 작업당 비용을 보여주는 보드를 만들었습니다.

요약

Claude Code 에이전트 사용 시 발생하는 비용을 실시간으로 모니터링하고, 작업 성격에 따라 모델을 분리하는 라우팅 전략을 소개합니다. 이를 통해 비용 효율적인 에이전트 워크플로우를 구축하는 방법을 다룹니다.

핵심 포인트

  • 실시간 토큰 수, 시간, 비용을 확인할 수 있는 모니터링 보드 구축
  • 작업 난이도에 따라 저렴한 모델과 고성능 모델로 분리하는 라우터 도입
  • 라우팅 로직을 통해 단순 작업의 비용을 약 1/10 수준으로 절감
  • 작업별 비용 가시성 확보를 통한 효율적인 업무 할당 가능

저는 서로 다른 작업들을 위해 Claude Code 에이전트를 계속 생성해 왔지만, 청구서가 나오기 전까지는 각각의 에이전트가 비용을 얼마나 쓰는지 제대로 알 수 없었습니다. 두 가지 방법이 이 문제를 해결해 주었습니다. 첫째, 모든 작업이 하나의 카드이며 실행 중인 각 에이전트가 자체적인 실시간 토큰 수(token count), 시간, 비용을 보여주는 하나의 보드입니다. 이제 더 이상 추측할 필요가 없습니다. 둘째, 배정(dispatch) 단계 앞에 작은 라우터(router)를 두었습니다. 기계적인 작업(분류(triage), 후속 목록 작성, 포맷팅)은 가격이 약 10분의 1 수준인 저렴한 모델로 보냅니다. 오직 무거운 추론(heavy reasoning) 작업에만 비싼 모델을 사용합니다. 실제 실행 결과, 받은 편지함의 분류(triage) 작업은 114초에 17센트가 소요된 반면, 전체 흐름을 구축하는 작업은 142초에 61센트가 소요되었습니다. 이 수치들을 나란히 확인하니 업무를 할당하는 방식이 바뀌었습니다. 작업별로 라우팅 로직(routing logic)이 어떻게 결정되는지 궁금하시다면 기꺼이 답변해 드리겠습니다. 직접 다시 만드는 대신 작동하는 버전을 원하는 분들을 위해 전체 패키지를 묶어두었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 r/ClaudeAI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0