Claude Code 35일간의 사용 기록: 약 50,000달러 상당의 토큰 사용량
요약
Claude Code를 35일간 집중적으로 사용한 결과, API 요율로 환산 시 약 50,000달러의 비용이 발생함을 분석했습니다. 대규모 프로젝트에서의 에이전트 활용 시 발생하는 막대한 토큰 사용량과 캐시 효율의 중요성을 보여줍니다.
핵심 포인트
- Claude Code의 35일간 API 환산 비용은 약 $51,300에 달함
- 캐시 읽기(Cache reads)가 전체 비용 구조에서 매우 큰 비중을 차지함
- Opus 모델의 높은 출력 토큰 비용이 전체 지출의 주요 원인 중 하나임
- 컨텍스트 최적화(CLAUDE.md 등)가 비용 절감에 필수적임을 시사함
저는 몇몇 대규모 프로젝트(주로 인터랙티브한 에이전트 보조 개발 작업 및 연구를 위한 상당량의 서브 에이전트 팬아웃(fan-out) 포함)에서 Claude Code를 집중적으로 사용하고 있습니다.
Max(200) 구독 대신 API를 통해 토큰당 비용을 지불한다면 실제 사용 비용이 얼마나 될지 궁금해졌습니다. 그래서 Claude가 35일간의 로컬 트랜스크립트(transcripts)를 스캔하여 모든 토큰 클래스를 현재 API 요율로 계산했습니다.
솔직히 지난 한 달 동안은 단순히 퍼센트(%) 변화를 지켜보며 주간 제한을 초과하지 않으려고 노력했을 뿐입니다. 하지만 지난 한 달 동안 몇 차례 무작위로 사용량이 리셋되는 행운이 있어 조금 더 많이 사용할 수 있었습니다.
총계: 약 2,600 세션 · 3억 4,500만(345M) 출력 토큰 · 25.7억(2.57B) 캐시 쓰기(cache-write) 토큰
모델별 사용량
| 모델 | 입력(Input) | 캐시 쓰기(Cache write) | 캐시 읽기(Cache read) | 출력(Output) |
|---|---|---|---|---|
| Opus 4.8 | 32.3M | 856M | 14.4B | 134.8M |
| Opus 4.7 | 2.0M | 518M | 15.7B | 68.4M |
| 미분류 (주로 Opus/Fable) | 18.2M | 867M | 15.4B | 112.6M |
| Fable 5 | 5.1M | 85M | 2.1B | 9.6M |
| Sonnet 4.6 | 1.5M | 190M | 5.1B | 18.7M |
| Haiku 4.5 | 1.0M | 60M | 0.7B | 1.4M |
| 총계 | 60.1M | 2.58B | 53.4B | 345.5M |
모델별 비용
| 모델 | 추정 비용 (35일) |
|---|---|
| Opus 4.8 | $16,100 |
| Opus 4.7 | $12,800 |
| 미분류 (주로 Opus/Fable) | $16,000 |
| Fable 5 | $3,700 |
| Sonnet 4.6 | $2,500 |
| Haiku 4.5 | $160 |
| 총계 | ~$51,300 |
표준 주간 리셋 2일 전에 제한이 리셋되었을 때, Fable을 사용하여 약 36시간 만에 1주일 치 사용 제한을 다 써버리기도 했습니다.
"미분류(unattributed)" 항목은 첫 번째 트랜스크립트 라인에 모델 ID가 명시되지 않은 세션들입니다. 이는 실제 트래픽이며 거의 모두 Opus 또는 Fable이지만, Opus 기본 가격으로 책정되었습니다.
저는 모든 캐시 쓰기(cache writes)가 5분 TTL(1.25x)을 사용한다고 가정했습니다. Max는 종종 1시간 TTL(2x)을 적용받습니다. 만약 제 사용량 중 큰 비중이 1시간 TTL이라면, 한 달에 약 3,000달러에서 5,000달러를 더 추가해야 합니다.
세 가지 사항:
캐시 읽기(Cache reads)는 조용한 거인입니다. 헤비한 모델당 약 150억 개의 캐시 읽기 토큰이 발생합니다. 토큰당 비용은 저렴하지만(입력 가격의 약 0.1배), 그 양이 엄청납니다. 이것은 매 턴마다 다시 읽히는 컨텍스트 바닥(context floor)(시스템 프롬프트 + 프로젝트 지침 + 대화 기록)입니다.
출력 토큰(Output tokens).
Opus 4.8에서만 1억 3,500만(135M) 개의 출력 토큰(output tokens)을 사용했으며, 비용은 100만 토큰당 25달러였습니다.
캐시 쓰기(Cache writes). 컨텍스트가 성장함에 따라 매 턴마다 컨텍스트의 일부를 다시 지불하게 됩니다.
최고 등급 구독(max subscription)에 대해 매우, 매우 만족스럽다고 말씀드리고 싶습니다. 다행히 실제로 한 달에 44,000달러를 쓰고 있는 것은 아닙니다. 하지만 토큰이 어디로 사라지는지, 그리고 왜 사람들이 CLAUDE.md 파일을 최적화하고 컨텍스트를 줄이는 작업에 그토록 공을 들이는지 이해할 수 있는 유용한 방법이었습니다. 이 정도 규모에서는 컨텍스트 바닥(context floor)이 승부의 핵심입니다.
프로젝트:
- 코드와
.ai프로젝트를 Cloudflare 위키 및 데이터베이스 + 작업/목표/결정 인프라와 연결하는 비서(Executive Assistant) 시스템 - EA와 자기 자신을 구축하며... 그 외 모든 것을 위한 코드 공장을 만드는 다크 팩토리(Dark Factory) 시스템
- 스타트업 운영
- 해당 스타트업을 위한 지구 관측 데이터용 초분광(Hyperspectral) 데이터 분석 엔진
- 몇 개의 웹사이트
- Factorio 스타일의 게임
제출자: /u/Resigned_Optimist
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/ClaudeAI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기