본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 04. 07:11

GitHub Copilot의 AI 크레딧 전환 정리 — 에이전트 모드에서 과금이 증가하는 원리

요약

GitHub Copilot이 기존 PRU 방식에서 토큰 기반의 AI Credits 종량제 과금 체계로 전환됨에 따라 에이전트 모드 사용자의 비용이 급증하고 있습니다. 에이전트 모드는 대량의 입력/출력 토큰을 소비하므로 사용량에 따른 추가 과금 위험이 커졌습니다.

핵심 포인트

  • 기존 PRU 방식에서 토큰 기반 AI Credits 종량제로 전환
  • 에이전트 모드는 대량의 토큰을 소비하여 비용 급증 가능성 높음
  • 코드 보완(Inline completion)은 여전히 무제한 제공
  • 1 AI Credit은 $0.01 USD로 환산되어 계산됨

본 기사는 Claude Code (Anthropic)를 활용하여 작성되었습니다.

검증 가능한 범위 내에서 공개 정보를 정리한 것이지만,

코드 예시 등은 실제 환경에서의 동작 확인을 권장합니다.

에이전트 모드(Agent mode)를 사용하기 시작했더니 월 청구 금액이 급증했다——6월에 들어서 X나 GitHub 커뮤니티에서 이러한 보고가 잇따르고 있다.

원인은 2026년 6월 1일부터 시행된 GitHub Copilot의 「AI Credits」 제도로의 완전 전환이다. 기존의 「Premium Requests (PRU)」라는 단위가 폐지되고, 실제 토큰(Token) 소비량에 기반한 종량제 과금으로 전환되었다. 코드 보완(Code completion)이 중심이라면 영향이 작겠지만, 에이전트 모드를 다용하는 사람에게는 무시할 수 없는 변화다.

이 기사에서는 무엇이 바뀌었는지, AI Credits의 계산 방법, 에이전트 모드에서 왜 크레딧이 급증하는지를 공개 정보로부터 정리한다. 청구 금액이 늘어난 이유를 파악하고 싶은 사람이, 읽고 난 뒤 자신의 사용 방식과 대책을 판단할 수 있는 내용을 목표로 했다.

지금까지 GitHub Copilot은 「Premium Requests (PRU)」라는 단위로 사용량을 관리해 왔다. GPT-4o나 Claude Sonnet 계열의 모델을 호출할 때마다 일정량의 PRU를 소비하며, 상한을 초과하면 저품질 모델로 폴백(Fallback)되는 구조였다.

2026년 6월 1일부터는 「GitHub AI Credits」로 대체되었다 (공식 발표). 주요 변경 사항은 다음과 같다:

플랜월액부여되는 AI Credits
Copilot Pro$10/월$10 분량 (1,000 크레딧)
...

기본 요금은 그대로 유지되지만, 부여된 크레딧을 초과한 분량은 자동으로 추가 과금된다 (이용 상한을 설정하지 않을 경우). 「월액이 변하지 않으니 안심」하는 것이 아니라, 소비량에 따라 상한 없이 늘어날 수 있다는 점이 구제도와의 최대 차이점이다.

1 AI Credit = $0.01 USD로 환산된다. 과금은 토큰 소비량 베이스로, 입력(Input)·출력(Output)·캐시(Cache)의 각 토큰 수에 모델별 단가가 곱해진다. 상세 단가는 GitHub Docs: Models and pricing에 공개되어 있다.

AI Credits를 소비하는 기능:

  • Chat (채팅)
  • Agent mode (에이전트 모드)
  • Code review (코드 리뷰)
  • Copilot CLI
  • Copilot Apps
  • Copilot 클라우드 에이전트

AI Credits를 소비하지 않는 기능 (계속 무제한):

  • Inline completion (코드 보완)
  • Next Edit Suggestions

코드 보완이 작업의 주체라면, 전환 전후로 청구 금액은 거의 변하지 않는다. 영향이 큰 것은 Chat이나 에이전트 모드를 적극적으로 사용하고 있는 케이스다.

구제도에서는 「1 PRU」로 처리되었던 조작이, 신제도에서는 실제 토큰 소비량에 비례하여 카운트된다는 점이 핵심이다.

에이전트 모드가 1개 태스크를 처리할 때, 내부에서는 다음과 같은 처리가 쌓인다:

  • 코드베이스 전체 또는 파일의 읽기 (대량의 입력 토큰)
  • 다단계 계획 수립과 실행 (출력 토큰)
  • 도구 호출(Tool call) 결과를 다음 프롬프트(Prompt)로 전달 (추가적인 입출력 토큰)

대규모 코드베이스에서 복잡한 태스크를 1개 세션 동안 실행하면, 단순한 채팅 1회의 수십~수백 배에 달하는 크레딧을 소비할 수 있다. GitHub Community의 Discussion에서는 「월 $29가 $750가 되었다」, 「$50가 $3,000를 넘었다」는 목소리도 보인다 (Discussion #192948).

구제도에서는 GitHub가 에이전트 이용의 인프라 비용을 흡수했으나, 에이전트 이용의 급증으로 인해 그것이 지속 불가능해졌다는 것이 전환의 이유로 꼽힌다.

1. 이용 상한(Spending limit)을 설정한다

GitHub 설정에서 월간 상한 금액을 고정할 수 있다. 상한에 도달하면 에이전트 모드 등은 정지되지만, 의도치 않은 무제한 과금을 방지하는 가장 확실한 수단이다. 설정 절차는 Usage-based billing for individuals에 기재되어 있다.

2. 모델을 의식하여 선택한다

고정밀 모델(Claude Sonnet 계열, GPT-4o 등)은 크레딧 소비가 크고, 경량 모델은 작다. 루틴한 보완에는 경량 모델을 사용하고, 중요한 작업에만 고성능 모델을 할당하는 운영 방식이 소비를 억제하는 방법이다.

3. 용도에 따라 도구를 구분하여 사용한다

코드 보완(Code completion) 및 인라인 편집(Inline editing)이 중심이라면 Copilot의 영향은 미미하다. 자율 에이전트(Autonomous agent)적인 워크플로우(리포지토리 전반에 걸친 변경, 여러 파일의 동시 수정 등)를 다용한다면, 다른 도구와의 역할 분담을 다시 정리해 볼 여지가 있다.

AI Credits 전환은 코드 보완을 주로 사용하는 사용자에게는 실질적인 영향이 거의 없다. 에이전트 모드(Agent mode)를 본격적으로 운용하고 있었다면, 우선 이용 한도를 설정하여 현재의 소비량을 파악하는 것부터 시작하는 것이 확실하다. GitHub 대시보드에서 월간 소비 트렌드를 확인하는 습관을 들여두면, 청구 금액의 급증을 조기에 감지할 수 있다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0