본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 10. 11:36

Claude Fable 5의 요금은 출력 $50보다 입력에서 결정된다: 1회 호출 실측

요약

Anthropic의 Claude Fable 5 출시와 관련하여, 실제 호출을 통해 비용 구조를 분석한 결과 출력 비용보다 입력 및 캐시 비용이 전체의 80%를 차지함을 확인했습니다. 무료 기간 동안 Claude Code의 JSON 출력을 활용해 자신의 워크로드에 따른 예상 비용을 실측할 것을 권장합니다.

핵심 포인트

  • 비용의 80%는 출력($50/1M)이 아닌 입력 및 캐시에서 발생함
  • Claude Code의 JSON 출력 형식을 통해 API 환산 비용 실측 가능
  • 에이전트 사용 시 시스템 프롬프트와 도구 정의로 인한 입력 토큰 급증 주의
  • 무료 기간을 활용해 향후 발생할 월간 운영 원가를 반드시 계산할 것

「Fable 5는 우선 벤치마크를 봐라」는 말은 아마 틀렸을 것이다. 먼저 봐야 할 것은 요금, 더 정확히 말하면 자신의 청구액 구조라고 생각한다. 실제로 1회 호출을 던져 실측해 보니, 비용의 8할이 「출력 이외」에서 발생하고 있었다.

어제(2026-06-09), Anthropic이 Claude Fable 5를 일반 공개했다(공식 발표). 6/22까지는 Pro/Max/Team/Enterprise에서 추가 요금 없이 이용 가능하며, 이후에는 $10/1M 입력 · $50/1M 출력의 종량제로 전환된다. 첫날의 타임라인은 「무료일 때 마음껏 놀아라」가 눈에 띄었지만, 나의 결론은 다르다. 이 2주는 노는 기간이 아니라, 자신의 워크로드(Workload) 원가를 실측하는 기간이다.

Claude Code(구독)가 있다면 API 키 없이도 측정할 수 있다. -p 명령의 JSON 출력에 비용 내역이 실린다.

claude -p --model claude-fable-5 --output-format json \
"TypeScript로 피보나치 함수를 하나 작성해줘" > out.json

돌아온 usage가 이것이다(수중 실측값).

total_cost_usd = 0.1322645
input_tokens = 3,165
cache_creation_input_tokens = 4,719
...

프롬프트는 1줄이다. 그런데 입력 측의 합계는 약 2.3만 토큰에 달한다. Claude Code의 시스템 프롬프트(System Prompt)와 도구 정의(Tool Definition)가 매번 컨텍스트(Context)에 올라가기 때문이며, 에이전트(Agent)로서 사용하는 한 이것이 표준 상태가 된다.

이 숫자가 공개 요금과 일치하는지 검산했다. 캐시 쓰기 1.25배 · 읽기 0.1배(Anthropic의 기존 캐시 요율)를 적용한다.

import json
# Claude Fable 5 공개 요금 (USD / 1M tokens)
IN, OUT = 10.0, 50.0
...

실행 결과.

재현 계산: $0.1322645
출력 토큰분만: $0.0263

소수점 7위까지 일치했다. $10/$50에 캐시 요율을 더한 정직한 산출로 CLI의 total_cost_usd를 설명할 수 있다.

막혔던 점이 두 가지 있다.

  • usage 상에서 캐시 쓰기는 전량이 1시간 TTL의 버킷(ephemeral_1h_input_tokens)에 들어있었는데, 일치한 것은 5분 TTL 상당인 1.25배였다. 기존 요율이라면 1시간 TTL은 2배여야 한다. CLI 측의 개산이 일률적으로 1.25배로 되어 있을 가능성이 있으므로, 청구 기반의 최종 확인은 Console 측의 숫자로 하는 것이 좋다.
  • total_cost_usd는 구독을 통한 경우 실제 청구액이 아니라 「API 환산 시 얼마인가」의 참고치다. 역으로 말하면, 추가 요금이 없는 지금이라도 원가를 그대로 볼 수 있다.

내역을 나누면, 출력은 $0.026으로 전체의 2할이다. 나머지 8할은 입력과 캐시다. $50/1M이라는 출력 단가가 가장 눈에 띄지만, 지갑을 깎아먹는 것은 입력 측이다. 서두의 「역(逆)」은 이것을 의미한다.

이 정도 규모의 호출을 하루 100번 수행하면 월 $400 미만이 된다. 비싼지 타당한지는 태스크(Task)에 따라 다르겠지만, 확실한 것은 이 견적은 벤치마크 점수에서는 절대 나오지 않는다는 점이다. --output-format json 로그를 쌓아서 usage를 합산하면, 6/23 이후의 자신의 월간 비용을 무료 기간 중에 알 수 있다.

Fable 5의 평가 축은 벤치마크 순위보다 자신의 태스크에서의 원가 대비 효과라고 생각한다. Anthropic 스스로도 민감한 화제는 구형 Opus 4.8로 보내는 라우팅(Routing)으로 운용하고 있을 정도이며(Ars Technica), 단일 모델에 모든 것을 맡기는 설계는 이제 본사에서도 하지 않는다. 사용하는 쪽도 마찬가지로, 난도는 Fable 5, 정형적인 작업은 저렴한 모델로 분배하는 방식에 수렴할 것이다. 그 분배의 판단 재료를 만들 수 있는 것이 6/22까지의 2주다. 마음껏 노는 것보다, 끝까지 측정하는 것이 남는 것이 더 크다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0