Claude Code 35일간의 사용 기록: 약 50,000달러 상당의 토큰 사용량

저는 몇몇 대규모 프로젝트(주로 인터랙티브한 에이전트 보조 개발 작업 및 연구를 위한 상당량의 서브 에이전트 팬아웃(fan-out) 포함)에서 Claude Code를 집중적으로 사용하고 있습니다.

Max(200) 구독 대신 API를 통해 토큰당 비용을 지불한다면 실제 사용 비용이 얼마나 될지 궁금해졌습니다. 그래서 Claude가 35일간의 로컬 트랜스크립트(transcripts)를 스캔하여 모든 토큰 클래스를 현재 API 요율로 계산했습니다.

솔직히 지난 한 달 동안은 단순히 퍼센트(%) 변화를 지켜보며 주간 제한을 초과하지 않으려고 노력했을 뿐입니다. 하지만 지난 한 달 동안 몇 차례 무작위로 사용량이 리셋되는 행운이 있어 조금 더 많이 사용할 수 있었습니다.

총계: 약 2,600 세션 · 3억 4,500만(345M) 출력 토큰 · 25.7억(2.57B) 캐시 쓰기(cache-write) 토큰

모델별 사용량

모델	입력(Input)	캐시 쓰기(Cache write)	캐시 읽기(Cache read)	출력(Output)
Opus 4.8	32.3M	856M	14.4B	134.8M
Opus 4.7	2.0M	518M	15.7B	68.4M
미분류 (주로 Opus/Fable)	18.2M	867M	15.4B	112.6M
Fable 5	5.1M	85M	2.1B	9.6M
Sonnet 4.6	1.5M	190M	5.1B	18.7M
Haiku 4.5	1.0M	60M	0.7B	1.4M
총계	60.1M	2.58B	53.4B	345.5M

모델별 비용

모델	추정 비용 (35일)
Opus 4.8	$16,100
Opus 4.7	$12,800
미분류 (주로 Opus/Fable)	$16,000
Fable 5	$3,700
Sonnet 4.6	$2,500
Haiku 4.5	$160
총계	~$51,300

표준 주간 리셋 2일 전에 제한이 리셋되었을 때, Fable을 사용하여 약 36시간 만에 1주일 치 사용 제한을 다 써버리기도 했습니다.
"미분류(unattributed)" 항목은 첫 번째 트랜스크립트 라인에 모델 ID가 명시되지 않은 세션들입니다. 이는 실제 트래픽이며 거의 모두 Opus 또는 Fable이지만, Opus 기본 가격으로 책정되었습니다.

저는 모든 캐시 쓰기(cache writes)가 5분 TTL(1.25x)을 사용한다고 가정했습니다. Max는 종종 1시간 TTL(2x)을 적용받습니다. 만약 제 사용량 중 큰 비중이 1시간 TTL이라면, 한 달에 약 3,000달러에서 5,000달러를 더 추가해야 합니다.

세 가지 사항:

캐시 읽기(Cache reads)는 조용한 거인입니다. 헤비한 모델당 약 150억 개의 캐시 읽기 토큰이 발생합니다. 토큰당 비용은 저렴하지만(입력 가격의 약 0.1배), 그 양이 엄청납니다. 이것은 매 턴마다 다시 읽히는 컨텍스트 바닥(context floor)(시스템 프롬프트 + 프로젝트 지침 + 대화 기록)입니다.

출력 토큰(Output tokens).

Opus 4.8에서만 1억 3,500만(135M) 개의 출력 토큰(output tokens)을 사용했으며, 비용은 100만 토큰당 25달러였습니다.
캐시 쓰기(Cache writes). 컨텍스트가 성장함에 따라 매 턴마다 컨텍스트의 일부를 다시 지불하게 됩니다.

최고 등급 구독(max subscription)에 대해 매우, 매우 만족스럽다고 말씀드리고 싶습니다. 다행히 실제로 한 달에 44,000달러를 쓰고 있는 것은 아닙니다. 하지만 토큰이 어디로 사라지는지, 그리고 왜 사람들이 CLAUDE.md 파일을 최적화하고 컨텍스트를 줄이는 작업에 그토록 공을 들이는지 이해할 수 있는 유용한 방법이었습니다. 이 정도 규모에서는 컨텍스트 바닥(context floor)이 승부의 핵심입니다.

프로젝트:

코드와 .ai 프로젝트를 Cloudflare 위키 및 데이터베이스 + 작업/목표/결정 인프라와 연결하는 비서(Executive Assistant) 시스템
EA와 자기 자신을 구축하며... 그 외 모든 것을 위한 코드 공장을 만드는 다크 팩토리(Dark Factory) 시스템
스타트업 운영
해당 스타트업을 위한 지구 관측 데이터용 초분광(Hyperspectral) 데이터 분석 엔진
몇 개의 웹사이트
Factorio 스타일의 게임

제출자: /u/Resigned_Optimist
[link] [comments]

Insights

Claude Code 35일간의 사용 기록: 약 50,000달러 상당의 토큰 사용량

요약

핵심 포인트

댓글

Asus ProArt PA32UCDMR 32인치 4K 전문가용 OLED 모니터 리뷰: 정밀함, 속도, 그리고 유연성

모건스탠리, 韓 주식 비중 확대로 상향…"코스피 9,000 다시 간다"

SEC 조사 속 Trump Media의 Truth API 데이터 피드 출시

삼전닉스 차익실현에 8% 추락…코스피 5% 급락

Asus ProArt PA32UCDMR 32인치 4K 전문가용 OLED 모니터 리뷰: 정밀함, 속도, 그리고 유연성

모건스탠리, 韓 주식 비중 확대로 상향…"코스피 9,000 다시 간다"

SEC 조사 속 Trump Media의 Truth API 데이터 피드 출시

삼전닉스 차익실현에 8% 추락…코스피 5% 급락