Claude Code 비용이 조용히 5배 급증했습니다 — 그리고 그들은 당신을 추적하고 있었습니다

요약

Anthropic의 Claude Code 사용 비용이 공지 없이 급증하고, 사용자 위치를 추적하는 코드가 발견되어 논란이 되고 있습니다. 이에 대응하여 단일 벤더 의존성을 줄이고 작업 유형에 따라 모델을 분산 사용하는 비용 최적화 전략이 필요합니다.

핵심 포인트

Claude Code의 실질 토큰 가용량이 약 80% 감소하며 비용 급증 발생
남용 방지를 명목으로 한 위치 추적 코드 삽입 논란 및 롤백
단일 AI 제공업체 의존에 따른 가격 및 개인정보 보호 리스크 존재
작업 난이도에 따른 모델 계층(Tier) 분산 사용으로 비용 절감 가능

이번 주는 Anthropic의 개발자 신뢰도에 있어 힘든 한 주였습니다.

보이지 않는 가격 인상

개발자 Vincent Schmalbach는 Claude Code의 실질 비용이 어떠한 가격 변경 공지 없이 약 5배 증가했음을 보여주는 상세 로그를 공개했습니다.

그의 수치는 반박하기 어렵습니다:

이전의 사용량이 많았던 주: 가시적인 Opus 토큰 약 8.9M 및 8.5M
현재 주: 가시적인 Opus 토큰 약 1.4M
동일한 구독. 동일한 기기. 동일한 워크플로우 (Workflow).

이는 동일한 금액 대비 토큰이 약 83% 감소했음을 의미합니다. 캐시 생성 (cache creation)을 포함한 그의 더 넓은 지표도 비슷한 이야기를 들려줍니다: 실질적인 출력량이 약 80% 감소했습니다.

가장 최악인 부분은 무엇일까요? 새로운 계정이 로그상에 가시적인 Opus 행이 전혀 없음에도 불구하고 5시간의 할당량을 모두 소진했다는 점입니다. 계측기는 움직였지만, 장부는 그 이유를 설명하지 못했습니다.

Schmalbach가 말했듯: _"개발자들에게 필요한 것은 화려한 진행 바가 아닙니다. 우리에게 필요한 것은 장부입니다."

추적 논란

같은 주에 보안 연구원들은 Claude Code가 중국에 있거나 중국 AI 연구소와 연관된 사용자를 식별하기 위해 **위치 추적 코드 (location-tracking code)**를 조용히 삽입하고 있다는 사실을 발견했습니다.

Anthropic은 이를 "남용 방지 (anti-abuse)"라고 불렀습니다. 해당 코드는 도메인 분류 목록을 숨기기 위해 XOR 인코딩과 base64를 사용했습니다. The Register의 보도에 따르면: _"이것은 악성 기능은 아니지만, 신뢰를 요구하는 개발자 도구로서는 기이한 선택입니다."

Reddit과 소셜 미디어에서의 반발 이후, Anthropic은 이를 롤백 (roll back)했습니다.

진짜 문제: 단일 벤더 의존성 (Single-Vendor Dependency)

이것들은 고립된 사건이 아닙니다. 이는 동일한 근본적인 문제의 증상입니다: 단일 AI 제공업체에 의존할 때, 당신은 가격, 개인정보 보호, 모든 것에 대해 그들의 처분에 맡겨지게 됩니다.

여러 제공업체에 걸쳐 AI 코딩 워크로드를 6개월 동안 운영하며 제가 배운 점은 다음과 같습니다:

모든 작업에 최고의 모델이 필요한 것은 아니다

우리는 30일간의 코딩 에이전트 사용량을 추적하여 일관된 패턴을 발견했습니다:

작업 유형	필요한 모델	비용 영향
아키텍처 결정	Frontier (Opus/Fable)	가치가 있음
...

수치

작업을 적절한 모델 계층 (model tier)으로 라우팅함으로써, 우리는 AI 코딩 비용을 월 1만 달러에서 월 3천 달러로 줄였습니다. AI를 덜 사용해서가 아니라, 각 작업에 적합한 AI를 사용했기 때문입니다.

상세 내역:

약 30%의 작업은 진정으로 프론티어 모델 (frontier models)이 필요했습니다.
약 40%는 미드 티어 (mid-tier) 모델로도 완벽하게 작동했습니다.
약 30%는 품질 차이 없이 가장 저렴한 옵션으로 실행할 수 있었습니다.

보너스로 얻는 프라이버시

여러 제공업체(providers)로 라우팅하면, 단일 기업이 귀하의 전체 코드베이스를 볼 수 없습니다. 이번 주의 추적 폭로 이후, 이것은 단순한 비용 최적화가 아니라 보안 관행 (security practice)이 되었습니다.

오늘 바로 할 수 있는 일

사용량 감사 (Audit): ccusage와 같은 도구는 토큰이 정확히 어디로 가는지 보여줍니다. 대부분의 개발자는 일상적인 작업에 얼마나 많은 비용이 들어가는지 보고 충격을 받습니다.
작업 분류: "전송"을 누르기 전에 자문해 보세요: 이것이 진정으로 Opus/Fable가 필요한가? 아니면 Sonnet으로도 충분히 처리 가능한가?
작업 수준 라우팅 (task-level routing) 시도: 계획(planning)은 프론티어 모델로, 구현(implementation)은 미드 티어로, 테스트는 가장 저렴한 모델로 라우팅하세요.
제공업체 다변화: 한 기업이 귀하의 가격 책정(pricing)과 프라이버시를 모두 통제하게 두지 마세요.

더 큰 그림

Anthropic은 훌륭한 모델을 만듭니다. Claude는 복잡한 작업을 위한 진정으로 최고의 코딩 AI입니다. 하지만 "최고의 모델"과 "유일한 모델"은 매우 다른 전략입니다.

귀하의 전체 개발 워크플로우 — 코드, 비용, 데이터를 단일 AI 벤더(vendor)에 맡기던 시대는 이번 주에 끝났습니다.

귀하만의 라우팅 계층 (routing layer)을 구축하세요. 귀하의 지갑과 지식재산권 (IP)이 고마워할 것입니다.

저는 10개 이상의 앱을 출시하는 팀의 창립자 Bo입니다. 저희는 작업 수준의 모델 라우팅을 통해 AI 코딩 비용을 70% 절감했습니다. AI로 저렴하게 구축하는 법에 대한 더 많은 내용은 X @aplomb2에서 확인하세요.

AI 자동 생성 콘텐츠

원문 바로가기

Insights