GitHub Copilot의 AI 크레딧 전환 정리 — 에이전트 모드에서 과금이 증가하는 원리 - Insights | Molayo

본 기사는 Claude Code (Anthropic)를 활용하여 작성되었습니다.

검증 가능한 범위 내에서 공개 정보를 정리한 것이지만,

코드 예시 등은 실제 환경에서의 동작 확인을 권장합니다.

에이전트 모드(Agent mode)를 사용하기 시작했더니 월 청구 금액이 급증했다——6월에 들어서 X나 GitHub 커뮤니티에서 이러한 보고가 잇따르고 있다.

원인은 2026년 6월 1일부터 시행된 GitHub Copilot의 「AI Credits」 제도로의 완전 전환이다. 기존의 「Premium Requests (PRU)」라는 단위가 폐지되고, 실제 토큰(Token) 소비량에 기반한 종량제 과금으로 전환되었다. 코드 보완(Code completion)이 중심이라면 영향이 작겠지만, 에이전트 모드를 다용하는 사람에게는 무시할 수 없는 변화다.

이 기사에서는 무엇이 바뀌었는지, AI Credits의 계산 방법, 에이전트 모드에서 왜 크레딧이 급증하는지를 공개 정보로부터 정리한다. 청구 금액이 늘어난 이유를 파악하고 싶은 사람이, 읽고 난 뒤 자신의 사용 방식과 대책을 판단할 수 있는 내용을 목표로 했다.

지금까지 GitHub Copilot은 「Premium Requests (PRU)」라는 단위로 사용량을 관리해 왔다. GPT-4o나 Claude Sonnet 계열의 모델을 호출할 때마다 일정량의 PRU를 소비하며, 상한을 초과하면 저품질 모델로 폴백(Fallback)되는 구조였다.

2026년 6월 1일부터는 「GitHub AI Credits」로 대체되었다 (공식 발표). 주요 변경 사항은 다음과 같다:

플랜	월액	부여되는 AI Credits
Copilot Pro	$10/월	$10 분량 (1,000 크레딧)
...

기본 요금은 그대로 유지되지만, 부여된 크레딧을 초과한 분량은 자동으로 추가 과금된다 (이용 상한을 설정하지 않을 경우). 「월액이 변하지 않으니 안심」하는 것이 아니라, 소비량에 따라 상한 없이 늘어날 수 있다는 점이 구제도와의 최대 차이점이다.

1 AI Credit = $0.01 USD로 환산된다. 과금은 토큰 소비량 베이스로, 입력(Input)·출력(Output)·캐시(Cache)의 각 토큰 수에 모델별 단가가 곱해진다. 상세 단가는 GitHub Docs: Models and pricing에 공개되어 있다.

AI Credits를 소비하는 기능:

Chat (채팅)
Agent mode (에이전트 모드)
Code review (코드 리뷰)
Copilot CLI
Copilot Apps
Copilot 클라우드 에이전트

AI Credits를 소비하지 않는 기능 (계속 무제한):

Inline completion (코드 보완)
Next Edit Suggestions

코드 보완이 작업의 주체라면, 전환 전후로 청구 금액은 거의 변하지 않는다. 영향이 큰 것은 Chat이나 에이전트 모드를 적극적으로 사용하고 있는 케이스다.

구제도에서는 「1 PRU」로 처리되었던 조작이, 신제도에서는 실제 토큰 소비량에 비례하여 카운트된다는 점이 핵심이다.

에이전트 모드가 1개 태스크를 처리할 때, 내부에서는 다음과 같은 처리가 쌓인다:

코드베이스 전체 또는 파일의 읽기 (대량의 입력 토큰)
다단계 계획 수립과 실행 (출력 토큰)
도구 호출(Tool call) 결과를 다음 프롬프트(Prompt)로 전달 (추가적인 입출력 토큰)

대규모 코드베이스에서 복잡한 태스크를 1개 세션 동안 실행하면, 단순한 채팅 1회의 수십~수백 배에 달하는 크레딧을 소비할 수 있다. GitHub Community의 Discussion에서는 「월 $29가 $750가 되었다」, 「$50가 $3,000를 넘었다」는 목소리도 보인다 (Discussion #192948).

구제도에서는 GitHub가 에이전트 이용의 인프라 비용을 흡수했으나, 에이전트 이용의 급증으로 인해 그것이 지속 불가능해졌다는 것이 전환의 이유로 꼽힌다.

1. 이용 상한(Spending limit)을 설정한다

GitHub 설정에서 월간 상한 금액을 고정할 수 있다. 상한에 도달하면 에이전트 모드 등은 정지되지만, 의도치 않은 무제한 과금을 방지하는 가장 확실한 수단이다. 설정 절차는 Usage-based billing for individuals에 기재되어 있다.

2. 모델을 의식하여 선택한다

고정밀 모델(Claude Sonnet 계열, GPT-4o 등)은 크레딧 소비가 크고, 경량 모델은 작다. 루틴한 보완에는 경량 모델을 사용하고, 중요한 작업에만 고성능 모델을 할당하는 운영 방식이 소비를 억제하는 방법이다.

3. 용도에 따라 도구를 구분하여 사용한다

코드 보완(Code completion) 및 인라인 편집(Inline editing)이 중심이라면 Copilot의 영향은 미미하다. 자율 에이전트(Autonomous agent)적인 워크플로우(리포지토리 전반에 걸친 변경, 여러 파일의 동시 수정 등)를 다용한다면, 다른 도구와의 역할 분담을 다시 정리해 볼 여지가 있다.

AI Credits 전환은 코드 보완을 주로 사용하는 사용자에게는 실질적인 영향이 거의 없다. 에이전트 모드(Agent mode)를 본격적으로 운용하고 있었다면, 우선 이용 한도를 설정하여 현재의 소비량을 파악하는 것부터 시작하는 것이 확실하다. GitHub 대시보드에서 월간 소비 트렌드를 확인하는 습관을 들여두면, 청구 금액의 급증을 조기에 감지할 수 있다.

Insights

GitHub Copilot의 AI 크레딧 전환 정리 — 에이전트 모드에서 과금이 증가하는 원리

요약

핵심 포인트

댓글

하락세가 주도권을 잡다: Tesla 주가, 수익 미달 이후 수개월간의 지지선 돌파

두 번째 Hermes Agent를 실행하고, 설치본을 복제하거나 새 기기로 이동하고, 업무와 개인용을 분리하는 방법

당신의 LLM 게이트웨이는 프롬프트를 개선할 수 있는 데이터를 버리고 있습니다

SoftReason: 고차원 지각 데이터에 대한 완전 미분 가능한 신경-소프트-심볼릭 연역 추론 아키텍처

하락세가 주도권을 잡다: Tesla 주가, 수익 미달 이후 수개월간의 지지선 돌파

두 번째 Hermes Agent를 실행하고, 설치본을 복제하거나 새 기기로 이동하고, 업무와 개인용을 분리하는 방법

당신의 LLM 게이트웨이는 프롬프트를 개선할 수 있는 데이터를 버리고 있습니다

SoftReason: 고차원 지각 데이터에 대한 완전 미분 가능한 신경-소프트-심볼릭 연역 추론 아키텍처