본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 01. 09:12

【비보】 Microsoft가 Claude Code를 해지! 「Tokenmaxxing」으로 월 $500M이 사라진 충격적인 진상

요약

에이전트형 AI인 Claude Code의 폭발적인 토큰 소비로 인해 Microsoft가 라이선스를 대량 취소하는 등 기업들의 비용 관리에 비상이 걸렸습니다. 사내 AI 활용도 평가를 위해 사용량을 부풀리는 'Tokenmaxxing' 현상이 발생하며 기업의 AI ROI(투자 대비 효과) 재검토가 시급해졌습니다.

핵심 포인트

  • 에이전트형 AI는 일반 쿼리 대비 최대 1,000배의 토큰을 소비함
  • 사내 리더보드 도입이 불필요한 토큰 소비를 유도하는 'Tokenmaxxing' 초래
  • Microsoft가 비용 문제로 Claude Code에서 GitHub Copilot CLI로 강제 전환
  • 토큰 단가 하락에도 불구하고 에이전트 사용량 급증으로 총 비용은 상승 중

「4개월 만에 연간 예산을 다 써버렸다」

Uber의 CTO가 이렇게 고백한 것은 2026년 5월의 일이다.

Claude Code의 도입률이 32%에서 84%로 급상승하며, 엔지니어 1인당 월액 $500~$2,000의 토큰 (Token) 비용이 발생. 5,000명의 엔지니어를 보유한 Uber에서는 말 그대로 「AI 때문에 회사가 망할 것 같은」 사태에 빠졌다.

그리고 지금, Microsoft, Amazon, Meta라는 거인들조차 같은 문제로 고통받고 있다.

Tokenmaxxing = AI 도구의 사용량을 부풀려 사내 랭킹을 올리는 행위.

Amazon, Meta, Uber는 「AI 활용도」를 가시화하기 위해 사내 리더보드 (Leaderboard)를 설치했었다. 토큰 소비량이 많은 팀일수록 「AI를 잘 활용하고 있다」고 평가받는 구조다.

무슨 일이 일어났는가?

엔지니어 「AI 랭킹을 올리지 않으면 평가가 낮아져..."
↓
필요 없는 태스크 (Task)도 AI에게 마구 던짐
...

Amazon은 내부 리더보드를 즉시 폐쇄. 「인프라와 AI 운영 비용이 대폭 증가했다」고 인정하고 있다.

2026년 6월 30일 - Microsoft가 Claude Code의 라이선스를 대량 취소하는 기한이다.

대상이 된 곳은 Experiences + Devices 부문. 즉:

  • Windows
  • Microsoft 365
  • Outlook
  • Teams
  • Surface

이러한 제품을 만드는 팀들이 Claude Code에서 GitHub Copilot CLI로의 강제 이행을 명령받았다.

이유는 단순하다 - 6개월 만에 「지속 불가능한 토큰 소비」가 발생했기 때문이다.

비교 항목일반적인 LLM 쿼리 (Query)AI 에이전트 (Claude Code 등)
1태스크당 토큰~수천수십만수백만
...

왜 이렇게 차이가 나는가?

Claude Code와 같은 「에이전트형 AI (Agentic AI)」는 하나의 지시(Instruction)에 대해:

  • 파일을 읽음 → 토큰 소비
  • 계획을 세움 → 토큰 소비
  • 코드를 생성 → 토큰 소비
  • 테스트를 실행 → 토큰 소비
  • 에러를 수정 → 토큰 소비
  • 재테스트 → 토큰 소비...

최대 1000배의 토큰을 소비한다.

어느 AI 컨설턴트의 클라이언트 기업이 Anthropic의 클라우드에 30일 동안 5억 달러 이상을 지불했다는 보고가 있다.

원인은 「직원에 대한 무제한 액세스」다.

  • 2025년 12월: Claude Code 도입 시작
  • 2026년 2월: 이용률이 배증
  • 2026년 5월:
    연간 AI 예산을 4개월 만에 소진

현재 Uber는 「AI의 투자 대비 효과 (ROI)」를 근본적으로 재검토 중이다. COO는 「정당화하기가 어려워졌다」고 코멘트하고 있다.

Goldman Sachs의 최신 리포트에 따르면:

2030년까지 에이전트형 AI의 토큰 소비는 24배 증가한다. 월간 120조 토큰이 소비되는 세상이 온다.

아이러니한 현실:

  • 토큰 단가는 매년 낮아지고 있다 (2030년에는 90% 감소 예측)
  • 하지만 에이전트 AI의 소비량은 폭발적으로 증가
    결과: 총 비용은 내려가지 않고, 오히려 올라간다

즉, 「AI는 사람을 고용하는 것보다 싸다」는 상식은 에이전트 시대에는 통하지 않는다.

싫어하는 업무만 자동화함 - 고가치 태스크가 아니라 귀찮은 잡무를 AI에게 통째로 떠넘김

  • ROI가 나오지 않음

단순한 태스크에 무거운 AI를 사용함 - 「Hello World」를 쓰는 데 Opus 4.7을 사용함

  • 토큰 낭비

전사 일제 도입으로 관리 붕괴 - 사용량 가시화 없음, 상한 설정 없음, 청구서가 나오고 나서야 깨달음

기밀 데이터를 AI에 전달함 - 보안 리스크, 컴플라이언스 (Compliance) 위반

{
"monthly_token_limit": 10000000,
"alert_threshold": 0.8,
...
태스크권장 모델월액 기준
단순한 코드 보완Haiku / GPT-4o mini$20~$50
...

전부 Opus로 할 필요는 없다.

# Claude Code 사용 상황 확인
claude usage --period month --format json
  • 「어떤 태스크가」 「얼마나 가속화되는지」를 사전에 측정

  • 토큰 비용 (Token cost)과 비교하여 의사결정

  • AI 사용량 ≠ 생산성

  • 결과물의 품질로 평가한다

Tokenmaxxing은 끝났다 - Fortune지는 그렇게 선언했다.

Meta는 사내 토큰 랭킹을 폐지했다. Microsoft는 대규모 라이선스 재검토를 실시했다.

앞으로 일어날 일:

  • 하이브리드 모델 (Hybrid model)의 부상 - 로컬 LLM + 클라우드 API의 조합
  • 토큰 효율성 경쟁 - 「적은 토큰으로 동일한 품질」이 차별화 요소가 됨
  • AI 리터러시 (AI Literacy) 교육의 의무화 - 사용법을 모르는 직원이 최대의 리스크

AI 에이전트 (AI Agent)는 강력하다. 하지만 관리 없이 사용하면 회사를 파산시킨다.

  • Microsoft가 Claude Code를 해지
  • Uber가 4개월 만에 연간 예산을 소진
  • 30일 만에 $500M이 사라진 기업도 존재

지금 바로 확인해야 할 사항:

  • 자사의 AI 토큰 소비량을 파악하고 있는가?
  • 사용량 상한선이 설정되어 있는가?
  • 태스크에 적합한 모델을 선택하고 있는가?

이 기사가 도움이 되었다면, 좋아요👍와 저장📌를 부탁드립니다!

질문이나 의견이 있다면 댓글로 알려주세요.

Microsoft 보고서가 AI의 실제 비용 문제를 폭로하다

Uber, 4개월 만에 2026년 AI 예산 전액 소진

직원들의 'Tokenmaxxing'이 역효과를 내며 빅테크 기업들에 AI 비용 위기 닥쳐

Tokenmaxxing은 끝났다. 이는 기업의 AI ROI를 측정하는 결함이 있는 방식이었다

AI 지출 악몽: 기업들이 30일 동안 5억 달러 이상을 지출하다

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0