본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 04. 16:38

GitHub Copilot의 새로운 AI 크레딧 과금 체계 계산 결과: 24배의 가격 차이가 모든 것을 바꾼다

요약

GitHub Copilot이 도입한 새로운 AI 크레딧 기반 토큰 과금 체계를 분석합니다. 기존의 요청 단위 과금에서 벗어나 모델별 토큰 사용량에 따라 비용이 책정되며, 선택하는 모델에 따라 비용 차이가 최대 24배까지 발생할 수 있습니다.

핵심 포인트

  • 코드 완성 기능은 여전히 기존 플랜에 포함되어 크레딧을 소모하지 않음
  • 에이전트 워크플로는 모델별 입력/출력/캐시 토큰에 따라 AI 크레딧 소비
  • 모델 선택(예: GPT-5.5 vs MAI-Code-1-Flash)에 따라 비용이 최대 24배 차이
  • 토큰 기반 과금은 실제 연산 비용을 반영하는 합리적인 체계로 전환

2026년 6월 1일, GitHub는 Copilot을 위한 새로운 과금 모델(billing model)을 도입했습니다. 제 Twitter 피드에 올라온 헤드라인들은 다음과 같았습니다:

  • "GitHub가 이제 토큰(token) 단위로 과금합니다"
  • "Copilot 자동 완성(autocomplete)은 더 이상 무료가 아닙니다"
  • "월 $10였던 Pro 플랜이 $30가 되었습니다"

이 중 두 가지는 틀렸습니다. 하나는 부분적으로 맞지만, 어떤 모델을 선택하느냐에 따라 완전히 달라집니다.

저는 오후 시간을 할애하여 GitHub 문서에서 실제 가격표를 추출하고, 5가지 실제 워크플로(workflow)를 바탕으로 계산을 수행했습니다. 수치는 공포에 질린 스레드들이 말하는 것과는 다릅니다.

요약 (TL;DR)

  • 코드 완성(Code completions) 및 다음 편집 제안(next edit suggestions)은 여전히 포함되어 있습니다. 이 기능들은 AI 크레딧(AI Credits)을 소비하지 않습니다. "이제 모든 자동 완성이 유료가 되었다"라고 말하는 사람은 틀렸습니다.
  • 기본 플랜 가격은 변경되지 않았습니다. Pro는 여전히 $10, Pro+는 여전히 $39, Business는 사용자당 $19, Enterprise는 사용자당 $39입니다.
  • 변경된 점: 에이전트 워크플로(agent workflows)가 이제 각 모델의 공시된 요율에 따라 입력/출력/캐시된 토큰(input/output/cached tokens)별로 책정된 AI 크레딧을 소비합니다.
  • 동일한 작업이라도 어떤 모델을 선택하느냐에 따라 비용이 24배 더 비싸거나 저렴해질 수 있습니다. 무거운 에이전트 실행 시 GPT-5.5 대신 MAI-Code-1-Flash를 선택하면 $1.85 대신 $0.28이 소요됩니다.
  • 청구 금액은 GitHub가 가격을 올려서가 아니라, 사용자의 행동에 따라 달라집니다. 무거운 에이전트 작업을 비싼 모델로 라우팅(route)하면 비용이 상승합니다. 저렴한 모델로 라우팅하면 비용이 내려가거나 일정하게 유지됩니다.

실제로 출시된 내용

요소6월 1일 이전6월 1일 이후
코드 완성 (Code completions)포함됨포함됨 (여전히 크레딧 미사용)
...

이전의 프리미엄 요청 단위(Premium Request Units) 체계는 실제 연산(compute)량이 얼마나 소비되었는지와 관계없이 모든 "요청(request)"을 하나의 단위로 취급했습니다. 3초짜리 hello-world 질문과 10분짜리 다단계 에이전트 작업 모두 1단위를 차감했습니다. 에이전트의 능력이 향상됨에 따라 이러한 계산 방식은 한계에 부딪혔습니다.

토큰 기반 과금(Token-based billing)은 추론(inference)이 GitHub에 실제로 발생시킨 비용을 반영합니다. 공급 측면에서는 합리적입니다. 이것이 사용자에게 더 많은 비용을 발생시킬지는 전적으로 사용자의 모델 선택에 달려 있습니다.

24배의 가격 차이

다음은 GitHub 문서의 모델 가격표를 $10 기준으로 정규화한 것입니다:

모델$10치 입력 토큰 (input tokens)$10치 출력 토큰 (output tokens)실제 사용 사례
GPT-5.4 nano50M8M가벼운 질의응답 (Q&A), 빠른 문장 재구성
...

GPT-5.4 nano를 사용하면 **$10로 50M의 입력 토큰 (input tokens)**을 얻을 수 있습니다. 반면 GPT-5.5는 2M를 제공합니다. 입력 토큰만 따져도 25배의 차이가 나며, 출력 토큰 (output tokens)은 24배 차이가 납니다. 동일한 개발 워크플로 (workflow)라 할지라도 어떤 티어 (tier)를 사용하느냐에 따라 비용이 달라집니다. 즉, 이제 여러분의 라우팅 (routing) 결정이 Copilot 청구서에서 가장 큰 변수가 되었습니다.

5가지 실제 워크플로의 비용

저는 제가 평범한 일주일 동안 실제로 수행하는 작업들과 일치하는 워크플로들을 선정했습니다. 각 행은 동일한 작업을 저가형 모델 (cheap model) vs 중간형 모델 (medium model) vs 프런티어 모델 (frontier model)에서 실행했을 때의 결과입니다.

워크플로 1: 작은 버그 수정 (입력 3K / 출력 1K)

  • MAI-Code-1-Flash: $0.0068 (0.68 크레딧)
  • Claude Sonnet 4.6: $0.024 (2.4 크레딧)
  • GPT-5.5: $0.045 (4.5 크레딧)

3줄짜리 버그 수정을 위해 Opus나 GPT-5.5가 필요하지는 않습니다. 저가형 모델이 7배 더 저렴하게 동일한 답변을 내놓습니다.

워크플로 2: 중간 규모의 에이전트 단계 (입력 10K / 출력 2K)

  • MAI-Code-1-Flash: $0.0165
  • Claude Sonnet 4.6: $0.060
  • GPT-5.5: $0.110

워크플로 3: 대규모 레포지토리 컨텍스트 전달 (입력 80K / 출력 5K)

  • MAI-Code-1-Flash: $0.0825
  • Claude Sonnet 4.6: $0.315
  • GPT-5.5: $0.550

이것이 대부분의 Copilot 에이전트 (agents)가 머무는 지점입니다. 레포지토리 컨텍스트 (repo context)의 한 덩어리를 읽고, 이를 작업 메모리 (working memory)에 유지하며, 변경 사항을 만드는 작업입니다. 7배의 차이는 일반적인 근무 시간 동안 복리로 쌓입니다.

워크플로 4: 헤비한 반복적 에이전트 (입력 250K / 출력 20K)

  • MAI-Code-1-Flash: $0.2775
  • Claude Sonnet 4.6: $1.05
  • GPT-5.5: $1.85

이것이 트위터 (Twitter)에서 모두를 놀라게 했던 실행 사례입니다. 만약 하루에 이런 작업을 50번 실행한다면, 단일 에이전트 작업에 $1.85를 쓰는 것은 정말 큰 금액입니다. 이는 하루 $92.50, 즉 개발자 한 명의 GitHub Copilot 청구서가 한 달에 약 $2,000에 달한다는 의미입니다.

하지만 동일한 작업을 MAI-Code-1-Flash로 실행하면 일일 비용은 $13.88, 즉 월 약 $300입니다. 혹은 Sonnet 4.6을 유지한다면 일일 $52.50, 즉 월 약 $1,150를 지불하게 됩니다.

모델 선택이 곧 청구서입니다.

워크플로우 5: 리뷰 중심 작업 (입력 100K / 출력 40K)

  • MAI-Code-1-Flash: $0.255
  • Claude Sonnet 4.6: $0.900
  • GPT-5.5: $1.700

실제로 제공되는 혜택

이제 월간 플랜에 AI 크레딧 (AI Credits)이 포함됩니다. 제공되는 크레딧의 가치는 다음과 같습니다:

플랜월간 요금월간 AI 크레딧달러 가치
Pro$101,500$15
...

두 가지 주목할 점이 있습니다:

  1. $10의 Pro 플랜에는 $15 상당의 크레딧이 포함됩니다. 포함된 크레딧을 사용한다면 실질적으로 이득입니다.
  2. Business/Enterprise 고객에게는 크레딧 풀 (pool)을 두 배로 늘려주는 3개월 프로모션이 제공됩니다. GitHub은 이번 전환이 불안감을 고조시킬 것이라는 점을 알고 있습니다. 그래서 대비책을 마련해 두었습니다.

"비용이 더 늘어날까?" 의사결정 트리

귀하의 특정 상황에서 비용이 저렴해질지 혹은 더 비싸질지 판단하는 저의 사고 방식은 다음과 같습니다:

def will_you_pay_more(your_workflow):
    # 코드 완성 (Code completions)은 여전히 포함됩니다. 만약 사용량의 90%가 이것이라면:
    if "mostly autocomplete" in your_workflow:
...

실제로 효과가 있는 비용 제어 레버 (Cost control levers)

Copilot 청구 금액을 예측 가능한 수준으로 유지하기 위해 제가 이번 주에 실행하고 있는 다섯 가지 방법입니다:

레버노력절감액방법
일상적인 작업에는 MAI-Code-1-Flash를 기본값으로 설정낮음50-90%Copilot 모델 선택기에서 설정
...

Business 또는 Enterprise 플랜을 사용 중이라면 사용자 수준의 예산 상한선 (budget cap) 설정이 가장 중요합니다. 크레딧 풀은 공유되므로, 헤비 유저 한 명이 팀 전체의 크레딧을 다 써버릴 수 있습니다. 사용자별 상한선을 설정하고 "예산 도달 시 사용 중단" 기능을 설정하여, 누군가가 하루에 $200의 급격한 비용 상승을 일으켜 당신을 놀라게 하는 일이 없도록 하세요.

내가 오늘 Copilot을 사용한다면 할 일

플랜별 구체적인 실행 방안입니다:

Pro 사용자 ($10/월):

  1. $15 상당의 크레딧 가치를 받게 됩니다. 이를 사용한다면 실질적인 이득입니다.
  2. MAI-Code-1-Flash를 기본 모델로 선택하세요.
  3. 코드 자동 완성 (autocompletes)은 여전히 무료이므로 걱정하지 마세요.
  4. 6월 말에 첫 달 사용 보고서를 검토하여 실제 소비량을 확인하세요.

Pro+ 사용자 ($39/월):

  1. 7,000 크레딧을 받게 되며, 이는 70달러의 가치와 같습니다. 여전히 이득입니다.
  2. 에이전트 (Agent) 작업을 대량으로 수행한다면, GPT-5.5 대신 Sonnet 4.6을 기본값으로 사용하세요. 동일한 크레딧으로 3~5배 더 많은 에이전트 단계 (Agent steps)를 수행할 수 있습니다.
  3. 자동 완성 (Autocomplete)에 대해서는 이전과 동일한 조언을 드립니다: 여전히 무료입니다.

Business/Enterprise 관리자:

  1. 누군가 대규모 에이전트 작업을 실행하기 전에 사용자당 예산 한도 (Budget caps)를 설정하세요. 이것이 가장 중요한 단일 설정 변경 사항입니다.
  2. 6월 1일부터 9월 1일까지 진행되는 프로모션 (사용자당 1,100~3,100 크레딧 추가 제공)을 활용하여, 프로모션이 만료되기 전 기준 사용량 (Baseline usage)을 측정하세요.
  3. 사용량 상위 10%의 사용자를 확인하세요. 이들은 긴 컨텍스트 (Long-context) 작업에 프런티어 모델 (Frontier models)을 실행하는 사용자들이 될 것입니다. 라우팅 (Routing)에 대해 논의하십시오.
  4. 9월 1일 이전에 모델 및 가격 책정 문서를 주의 깊게 읽으십시오.

더 큰 그림

이것은 GitHub에만 국한된 이야기가 아닙니다. 이는 2026년 AI 제공업체 전반에서 나타나고 있는 패턴과 일치합니다:

  • Doubao (ByteDance, 5월 4일) — 중국 소비자용 AI가 3단계 유료 구독 모델을 도입함
  • Anthropic Mythos — Opus 상위의 프리미엄 티어, 100만 토큰당 25달러/125달러로 예상됨
  • GitHub Copilot (오늘) — 사용량 기반 에이전트 과금
  • OpenAI — 월 200달러의 Pro 티어를 포함한 다중 티어 출시

무료 또는 정액제 시대가 저물고 있습니다. 모든 주요 AI 서비스는 "실제로 소비하는 만큼 지불하는" 방식으로 이동하고 있습니다. 그 대가로, 가벼운 사용자에게는 더 저렴해지지만 파워 사용자에게는 더 비싸지며, 여러분의 라우팅 (Routing) 결정이 청구서에서 가장 큰 변수가 됩니다.

올바른 대응은 패닉이 아니라 계측 (Instrumentation)입니다. 각 모델에서 각 작업 유형이 얼마의 비용이 드는지 파악하고, 일상적인 작업에는 저렴한 모델을 기본값으로 사용하며, 상위 사용자에게는 한도를 설정하십시오. GitHub의 과금 체계 변경은 제가 지금까지 본 것 중 "실제 비용이 얼마인지"를 가장 명확하게 보여주는 인터페이스입니다.

만약 여러분이 설정 기반 라우팅 (config-driven routing)을 통해 하나의 OpenAI 호환 엔드포인트(OpenAI-compatible endpoint)로 OpenAI / Anthropic / Google 모델 간을 전환하고 싶다면 (즉, 코드 변경 없이 기본값을 변경할 수 있도록), TokenMix가 대략 그런 역할을 수행합니다. 공개 사항: 저는 연구 부문에서 일하고 있습니다. Copilot 가격표에 대한 전체 인용 분석 내용은 원본 기사에서 확인하실 수 있습니다.

결론 (Bottom line)

GitHub는 몰래 요금을 인상한 것이 아닙니다. 그들은 여러분의 라우팅 결정이 청구서에 나타나도록 표면적인 구조를 변경했습니다. 기본적으로 저렴한 모델을 선택하고 예산 상한선(budget caps)을 설정하면 요금이 내려갑니다. 생각 없이 비싼 모델을 선택하면 깜짝 놀라게 될 것입니다.

어느 쪽이든, "비용에 상관없이 1 Copilot 요청 = 1 단위"인 시대는 끝났습니다. 어디에서나 말이죠.

6월 1일 이후 여러분의 Copilot 라우팅 전략은 어떤 모습인가요? 댓글을 남겨주세요.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0