Claude의 6월 15일 가격 정책 분리: 계량기가 돌아가기 전 Indie Dev들이 실제로 해야 할 일

제가 $20 Pro 구독 내에 얼마나 많은 프로그래밍 방식의 Claude 사용량이 숨겨져 있었는지 처음 깨달은 것은, 모든 Pull Request(PR)마다 claude -p를 실행하는 GitHub Action을 추가했을 때였습니다. 이 Action은 세 가지 작업을 수행했습니다: diff(차이점) 요약, 릴리스 노트 초안 작성, 그리고 새로 수정된 모든 환경 변수(env vars) 플래그 표시. 잘 작동했습니다. 저는 이를 배포했습니다. 그리고 잊어버렸습니다. 3주 후, 저는 40개의 PR을 푸시했고, 재시도 및 재실행을 포함하여 Action은 약 110번 실행되었습니다. 저는 청구서를 본 적이 없습니다. 작업이 무료였기 때문이 아니라, Anthropic이 조용히 비용을 부담하고 있었기 때문입니다. 저는 한 달에 $20를 지불하고 있었지만, 제 대략적인 계산으로는 해당 기간 동안 $80에서 $180 사이의 API 사용량을 소비하고 있었습니다. 구독 서비스가 핵심적인 역할을 수행하고 있었고, 그 구독은 매우 훌륭한 거래였습니다. 그 거래는 2026년 6월 15일에 종료됩니다.

Anthropic은 5월 13일에 해당 날짜부터 Claude 구독이 두 개의 과금 풀(billing pools)로 분리된다고 발표했습니다. 대화형 사용(Interactive use: claude.ai, 사용자가 직접 마주하는 터미널 Claude Code 세션, Cowork)은 현재 상태 그대로 유지됩니다. 프로그래밍 방식의 사용(Programmatic use: Claude Agent SDK, claude -p, Claude Code GitHub Actions, 귀하의 구독을 통해 통신하는 모든 제3자 하네스(third-party harness))은 달러로 표시되며 전체 API 요율로 청구되는 새로운 월간 Agent SDK 크레딧 풀로 이동합니다. 헤드라인 구독 가격은 변하지 않습니다. 귀하의 $20 플랜은 여전히 $20입니다. 하지만 귀하의 스크립트가 마셔오던 버킷(bucket)은 조용히 '무제한 제공(all-you-can-eat)' 상태를 멈추게 됩니다. 이 포스트는 해당 발표의 실무적인 버전입니다. 새로운 풀이 실제로 어떤 모습인지, 아무도 공개하지 않는 비용 계산법, 누가 이기고 누가 지는지, 그리고 계량기가 작동하기 전 귀하의 CI와 스크립트에서 변경해야 할 구체적인 사항들을 다룹니다.

6월 15일에 실제로 변하는 것
변화의 형태는 간단합니다. 오늘날 스크립트, CI 작업, 또는 귀하의 구독을 통해 인증하는 모든 도구에서 Claude를 호출할 때, 그 호출은 claude.ai에서의 채팅과 동일한 속도 제한(rate-limited)이 적용되는 구독 버킷을 사용합니다.

헤비 유저(Heavy users)는 속도 제한(rate limits)이 있고 라이트 유저(light users)는 없으며, 누구도 토큰당 비용을 지불하지 않습니다. 6월 15일 이후에는 동일한 호출이라도 매달 초기화되고 모든 토큰을 표준 API 요율로 청구하는 별도의 달러 표시 풀(dollar-denominated pool)을 사용하게 됩니다. Anthropic의 가격 페이지는 새로운 풀을 대략 다음과 같이 설명합니다:

플랜	구독 가격	새로운 월간 Agent SDK 크레딧
Free	$0	없음
Pro	$20	$20 (최대 5배)
Max	$100	$100 (최대 20배)
Team Standard	좌석당 약 $25	좌석당 약 $20
Team Premium	좌석당 약 $125	좌석당 약 $100
Enterprise	맞춤형	맞춤형

크레딧은 사용자당 제공됩니다. 팀 전체로 합산되지 않으며, 이월되지도 않습니다. 크레딧을 모두 사용하면 프로그래밍 방식의 호출(programmatic calls)은 중단되거나, 계정에서

단 한 번의 claude -p 호출을 가정해 봅시다. 중간 규모의 PR(Pull Request)에 대해 claude -p "summarise this diff"를 실행한다고 가정합니다. Diff(차이점)는 약 8k 토큰입니다. 시스템 프롬프트(System Prompt)와 도구 정의(Tool definitions)가 추가로 4k를 차지합니다. Claude는 600토큰의 요약을 작성합니다. 즉, 입력 12k와 출력 600이므로, $0.012 * $3 + $0.0006 * $15 = $0.045가 됩니다. 대략 4.5센트입니다. 저렴합니다. $20의 크레딧을 다 쓰기 전까지 이를 440번 실행할 수 있습니다. 많아 보일 수도 있습니다. 하지만 그렇지 않습니다. 이를 CI(지속적 통합)에 넣었을 때 어떤 일이 발생하는지 보십시오. 모든 PR에 대해 Claude Code GitHub Action을 실행합니다. Diff는 동일하지만, 액션은 Claude를 두 번 더 호출합니다. 한 번은 릴리스 노트(Release note) 초안 작성을 위해, 한 번은 위험한 변경 사항을 찾기 위해 호출합니다. 도구 사용(Tool use)과 두 번째 호출 시 더 길어지는 컨텍스트 윈도우(Context window)를 고려하면, PR당 3회의 호출이 발생하며 평균적으로 PR당 $0.13가 소요됩니다. 한 달에 10개의 PR이면 $1.30로 기본적으로 무료입니다. 매일 배포하는 소규모 팀의 일반적인 수준인 한 달에 50개의 PR이면 $6.50로 여전히 괜찮습니다. 커밋당 PR 관행을 사용하는 소규모 조직이나 팀 전체에서 발생하는 200개의 PR이면 $26입니다. PR 리뷰만으로 이미 $20 크레딧을 다 써버렸고, 아직 본인이 직접 실행한 claude -p는 단 한 번도 없습니다. 백그라운드 에이전트 루프(Background agent loop)가 문제입니다. 여기서 상황이 험악해집니다. 10분마다 실행되어 최근 로그를 읽고, 당신에게 페이지(Paging)를 보낼 가치가 있는 내용이 있는지 결정하는 루프입니다. 각 반복(Iteration)은 대략 6k 입력과 400 출력으로, 호출당 $0.024입니다. 시간당 6회, 하루 144회, 하루 약 $3.40, 루프 하나당 한 달에 약 $100입니다. 29일 만에 $100 최대 크레딧(Max credit)에 도달하고, 58일 만에 $200 최대 크레딧에 도달합니다. 만약 루프가 충돌 후 더 공격적으로 재시작되거나, 루프를 두 개 운영하거나, 혹은 누군가의 스택 트레이스(Stack trace)가 길어서 단 한 번의 반복에서 실수로 60k의 로그 컨텍스트를 불러온다면, 수치는 빠르게 치솟습니다. 예상치 못한 요금(Surprise charges)이 발생하는 지점도 바로 여기입니다. 지난 5월에 떠돌던 이야기는, 커밋 메시지에 "HERMES.md"라는 문자열이 포함되어 있었다는 이유로 제3자 도구 사용(Third-party tool use)으로 자동 플래그가 지정되어, 대화형(Interactive)이 아닌 프로그래밍 방식(Programmatic)으로 과금되는 바람에 API 비용으로 $200.98를 청구받은 개발자의 사례입니다.

해당 스크린샷이 바이럴(viral)된 이후 Anthropic은 결국 결정을 번복했지만, 교훈은 남았습니다. 분류기(Classifier)는 사람들이 생각하는 것보다 더 많은 작업을 수행하고 있으며, "내가 Claude와 채팅하고 있는 것"과 "Claude가 나를 대신해 행동하고 있는 것" 사이의 경계는 여러분이 바라는 것보다 더 모호합니다. 이번 주에 여러분이 할 수 있는 가장 유용한 일은 여러분의 실제 사용량에 대해 실제 수치를 계산해 보는 것입니다. 여러분이 사용한다고 생각하는 양이 아니라, 실제로 사용하는 양 말입니다.

누가 이기고, 누가 지는가
6월 15일의 변화를 단순하게 해석하면, 이전에는 동일한 바구니에 담겨 있던 사용자들을 두 개의 바구니로 분류한다는 것입니다. 승자는 가벼운 스크립트 작성자(light scripters)들입니다. 만약 여러분이 일주일에 두세 번 정도 claude -p를 실행한다면, 여러분은 구독 요금제의 속도 제한(rate limit)에 근처에도 가본 적이 없을 것이며, 계량기(meter)가 없었기 때문에 계량기를 본 적도 없을 것입니다. 6월 15일부터 여러분은 결코 다 쓰지 못할 20달러(또는 100달러, 200달러) 규모의 바구니를 갖게 됩니다. 여러분에게 이번 가격 정책 변경은 무료 업그레이드와 같습니다. 이전에는 없었던 명시적인 제한과 투명한 예산을 갖게 되는 것이니까요. 만약 여러분의 사용 패턴이 이렇다면, 여기서 읽기를 멈추셔도 좋습니다.

패자는 단일 시트(single seat)에서 24/7 자동화를 실행하거나 공유 CI(Continuous Integration)를 실행하는 모든 사람입니다. Zed의 블로그는 사라지게 될 암묵적 보조금(implicit subsidy)에 대해 구체적인 수치를 제시했습니다. 그들은 Claude 구독이 "이전에는 API 가격과 비교했을 때 에이전트(agent) 사용을 대략 15배에서 30배 정도 보조해 주었다"라고 썼습니다. 이를 번역하면 6월 15일의 진짜 이야기가 나옵니다. 즉, 프로그래밍 방식(programmatic)의 사용자들은 15배에서 30배의 할인을 받고 있었던 것입니다. 그 할인은 이제 사라졌습니다. 크레딧 풀(credit pool)은 단지 새로운 정가(rack rate)를 조금 더 보기 좋게 만들어 줄 뿐입니다.

또 다른 패자 그룹은 팀(teams)입니다. 크레딧은 사용자 간에 공유되지 않습니다. 만약 여러분이 팀 플랜(Team plan)을 사용하는 세 명의 엔지니어를 두고 있고, 그중 한 명이 모든 CI 자동화를 실행한다면, 첫 번째 시트가 11일째에 소진되는 동안 나머지 두 시트의 20달러 크레딧은 사용되지 않은 채 남아 있게 됩니다. 해결책은 자동화를 자체 결제 시스템을 갖춘 전용 API 키를 사용하도록 리팩터링(refactor)하거나, 공학적으로는 말이 안 되지만 회계적으로는 말이 되는 방식으로 작업을 여러 시트에 분산시키는 것입니다. 둘 다 까다로운 방법입니다. 그리고 마지막으로, 정말 헤비한(heavy) 사용 사례가 있습니다.

Raindrop.ai의 CTO인 Ben Hylak은 이번 변경 사항에 대해 "정말 어리석거나, 아니면 Anthropic이 GPU와 관련하여 얼마나 좋지 않은 상황에 처해 있는지를 보여주는 것"이라고 말했습니다. 두 번째 해석이 흥미로운 지점입니다. 만약 Anthropic이 대화형 채팅(interactive chat)은 그대로 유지하면서 백그라운드 에이전트 루프(background agent loops)의 가격을 인상함으로써 컴퓨팅 자원(compute)을 배분하고 있다면, 이는 상시 가동되는 자동화(always-on automation)의 롱테일(long tail)을 보조하는 것이 경제적으로 고통스러운 수준에 도달했음을 시사하는 것입니다. 상시 가동되는 Claude에 스타트업의 운명을 걸 것인지 결정할 때 이 신호는 매우 중요합니다.

6월 15일 이전에 변경해야 할 사항: 체크리스트
다음 한 달 동안 당신이 할 수 있는 작업의 대부분은 사소한 것들입니다. 하지만 이는 6월 16일에 깨끗한 월간 청구서를 보며 깨어날 것인지, 아니면 공동 창업자로부터 왜 OpenAI 인보이스에 Claude 항목이 포함되어 있느냐는 Slack 메시지를 받으며 깨어날 것인지를 결정짓는 차이입니다.

프로그래밍 방식으로 Claude를 호출하는 모든 곳을 감사(Audit)하십시오. 이것은 아무도 하고 싶어 하지 않는 작업입니다. 하지만 동시에 유일하게 중요한 작업이기도 합니다.

대략적인 1차 탐색:
rg -n "anthropic|claude" .github/workflows scripts apps packages

당신은 모든 cron, 모든 action, 모든 script, 모든 server route, 모든 background worker를 찾아야 합니다. 이 목록을 실제 종이에 적으십시오. 각 항목에 대해 두 가지 질문에 답하십시오: 얼마나 자주 실행되는가, 그리고 실행당 대략 몇 개의 토큰(tokens)을 사용하는가. 만약 모른다면, 계측(instrument)을 수행하고(아래 참조) 다음 주에 다시 확인하십시오.

모든 claude -p 및 Agent SDK 호출에 토큰 수준의 로깅(logging)을 추가하십시오. Anthropic SDK는 응답(response)에 사용량(usage)을 반환합니다. 모든 호출을 작은 로거(logger)로 감싸고 그 결과를 파일이나 기존의 관측성 스택(observability stack)에 덤프(dump)하십시오.

구체적인 패턴:

const SONNET_INPUT_PER_M = 3;
const SONNET_OUTPUT_PER_M = 15;
const client = new Anthropic();

type ClaudeCallContext = {
  caller: string;
  workflow?: string;
};

export async function runClaude(
  args: Anthropic.MessageCreateParams,
  context: ClaudeCallContext,
) {
  const start = Date.now();
  const response = await client.messages.create(args);
  const inputTokens = response.usage.input_tokens;
  const outputTokens = response.usage.

output_tokens ; const cost = ( inputTokens / 1_000_000 ) * SONNET_INPUT_PER_M + ( outputTokens / 1_000_000 ) * SONNET_OUTPUT_PER_M ; logger.info({ event: 'claude_call', caller: context.caller, workflow: context.workflow, inputTokens, outputTokens, cost, durationMs: Date.now() - start, }); return response; } 일주일간의 이 데이터는 어떤 워크플로 (workflow)가 저렴한지, 어떤 것이 위험한지, 그리고 어떤 것이 3일 만에 당신의 미래 크레딧 풀 (credit pool)을 바닥내고 있는지 알려줍니다. 중요한 숫자는 호출당 토큰 (tokens per call)이 아니라, 워크플로당 일일 달러 비용 (dollars per day per workflow)입니다. 모든 곳에 명시적인 max_tokens를 설정하세요. 크레딧 풀을 파괴하는 가장 흔한 방법은 통제 불능의 응답 (runaway response)입니다. 작업에 현실적인 수준으로 max_tokens를 설정하세요. 변경 사항 요약 (diff summary)에 4096 토큰이 필요하지는 않습니다. 600이면 충분합니다. 릴리스 노트 생성기 (release note generator)에 8000은 필요하지 않습니다. 1500이면 충분합니다. 모델은 이 제한 (cap)을 준수할 것입니다. 당신의 지갑이 고마워할 것입니다. GitHub Actions 실행을 동시성 (concurrency) 및 조건문 가드 (if guards)로 제한하세요. 팬아웃 패턴 (fan-out pattern)은 수도꼭지를 틀어놓은 것과 비용 측면에서 동일합니다. 만약 당신의 액션 (action)이 push 시 실행된다면, 모든 커밋이 이를 트리거합니다. 만약 pull_request 시에도 실행한다면, 동일한 커밋이 두 번 트리거됩니다. 동일한 PR에 대해 진행 중인 실행을 취소하는 동시성 블록 (concurrency block)을 추가하고, 초안 (drafts)을 건너뛰는 if 가드 (if guard)를 추가하세요:

concurrency:
group: claude-${{ github.workflow }}-${{ github.ref }}
cancel-in-progress: true

jobs:
review:
if: github.event.pull_request.draft == false
runs-on: ubuntu-latest
steps:
- uses: anthropic/claude-code-action@v1

이 단 한 번의 변경만으로도 저의 액션 비용을 절반으로 줄였습니다. 저는 초안 브랜치 (draft branch)에 push할 때마다 실행이 대기열에 쌓이도록 방치했었기 때문입니다. 워크플로별로 결정하세요: 구독 크레딧 (subscription credit), 직접 API (direct API), 또는 종료 (off). 이것이 전략적 선택입니다. 1단계에서 찾은 각 프로그래밍 방식의 Claude 호출에 대해 세 가지 경로 중 하나를 선택하세요. 구독 크레딧은 예측 가능하고, 한 달에 실행되는 횟수가 정해져 있으며, 플랜의 할당량 내에 편안하게 들어오는 작업들을 위한 것입니다.

Direct API는 실제 예산 알림 (budget alerts), 팀 단위의 풀링 (team-wide pooling), 또는 크레딧을 초과하는 볼륨이 필요한 작업들을 위한 것입니다. Off는 해당 워크플로우를 더 저렴한 모델 (Haiku 또는 Claude 이외의 대안)로 전환하거나, 해당 작업이 비용을 들일 가치가 없다고 결정하는 것을 의미합니다. 오버플로 (overflow)가 발생하는 API 키에 대해 지출 알림 (spending alerts)을 설정하세요. 작업이 단순히 중단되지 않도록 추가 사용 (extra usage)을 활성화했다면, $50에서 한 번, $200에서 또 한 번 예산 알림을 설정하십시오. Anthropic 콘솔은 이를 지원합니다. 설정하지 않으면, 6월 청구서가 깜짝 선물처럼 도착할 것입니다. 설정을 해두면 예상치의 50% 시점에 Slack 메시지를 받을 수 있으며, 계속 진행할지 아니면 연결을 끊을지 결정할 수 있습니다. 결정론적 프롬프트 (deterministic prompts)를 사전 캐싱 (Pre-cache) 하세요. 만약 동일한 시스템 프롬프트 (system prompt)가 모든 호출에 포함되고 그 길이가 4k 토큰이라면, y

Claude의 6월 15일 가격 정책 분리: 계량기가 돌아가기 전 Indie Dev들이 실제로 해야 할 일

요약

핵심 포인트

댓글