GitHub Copilot이 이제 사용량 기반으로 변경됩니다. 터미널 사용자에게 미치는 영향은 무엇일까요?

2026년 6월 1일부로 모든 GitHub Copilot 플랜은 사용량 기반 과금 (usage-based billing) 방식으로 운영됩니다. 프리미엄 요청 단위 (Premium request units)는 사라졌습니다. 이를 대체하는 것은 GitHub AI Credits라고 불리는 토큰 측정 통화입니다. 1 크레딧은 1센트에 해당하며, 모든 모델 상호작용은 소비된 입력 (input), 출력 (output), 캐시된 토큰 (cached tokens)을 기반으로 각 모델의 공시된 요율에 따라 크레딧으로 변환되어 청구됩니다.

GitHub의 설명에 따르면, Copilot이 기존의 가격 체계를 넘어섰기 때문입니다. 한 줄의 완성 (completion)과 수 시간 동안의 자율적인 실행 (autonomous run)이 과거에는 동일한 비용이 들었으나, 에이전트 방식의 사용 (agentic use)이 주류가 되면서 이러한 고정 요금제는 그 이면의 컴퓨팅 자원과 일치하지 않게 되었습니다. 가격을 토큰에 연동함으로써 이러한 불일치를 해결합니다.

만약 귀하의 Copilot 사용이 주로 자동 완성 (autocomplete) 위주라면, 이는 거의 체감되지 않을 것입니다. 하지만 터미널에서 Copilot을 에이전트 (agent)로 구동한다면, 어떤 동작에 비용이 발생하는지가 달라집니다. 실질적인 변화 양상은 다음과 같습니다.

요청 (Requests) 대신 토큰 (tokens) 중심

기존 모델: 각 상호작용은 월간 요청 허용량에서 차감되며, 모델별 승수 (multiplier)에 따라 조정되는 하나의 프리미엄 요청 (premium request) 비용이 발생했습니다.

새로운 모델: 각 상호작용은 선택한 모델의 토큰 비용만큼의 비용이 발생합니다. 모든 유료 플랜에는 여전히 크레딧으로 표시되는 월간 풀 (monthly pool)이 제공되며, 이를 초과하는 사용량에 대해 예산을 설정할 수 있는 옵션이 있습니다. 공시된 수치에 따르면 포함된 풀은 Pro의 경우 1,500 크레딧, Pro+는 7,000 크레딧, Max는 20,000 크레딧이며, Business 및 Enterprise 플랜은 사용자당 풀 허용량이 제공됩니다.

자동 완성 (Autocomplete)은 변함없음

사용량을 배분하기 시작하기 전에, 변하지 않은 부분을 먼저 말씀드리겠습니다.

인라인 완성 (Inline completions)과 다음 편집 제안 (Next Edit Suggestions)은 여전히 무제한이며 무료입니다. 만약 귀하의 업무가 주로 에디터에서의 탭 완성 (tab-completion) 위주라면, 비용은 5월과 동일하게 나타날 것입니다. 그 부분은 모니터링할 필요가 없습니다.

측정 대상은 나머지 부분입니다: 채팅 (chat), 그리고 특히 파일을 열고, 계획을 세우고, 명령을 실행하며, 반복 (iterate)하는 에이전트 방식의 실행 (agentic runs)입니다. 이 영역이 급격히 팽창했으며, 새로운 가격 체계가 구축된 핵심 영역입니다.

터미널이 타격을 입는 지점입니다

CLI (Command Line Interface)에서는 어떤 모델이 답변할지 사용자가 직접 결정합니다. 6월 이전까지 이는 단순히 품질을 위한 선택이었을 뿐 그 외의 의미는 없었습니다. 사소한 작업에 가장 강력한 모델을 사용하는 데에는 눈에 보이는 추가 비용이 들지 않았습니다.

이제는 토큰당 가격 (per-token prices)이 그 선택 뒤에 자리 잡고 있으며, 모델 간의 가격 차이도 매우 큽니다. GitHub이 공개한 요율을 분석한 한 결과에 따르면, 가장 비싼 모델의 출력 비용은 가장 저렴한 모델보다 몇 배나 높았습니다. 이 차이가 너무 커서 무의식적으로 헤비급 모델을 사용하는 것은 기본적으로 '결제 오류'나 다름없는 상황입니다. 문단 하나를 재구성하기 위해 헤비급 모델을 돌리는 것은 이제 단순히 낭비가 아니라, 비용이 발생하는 낭비 (billable waste)가 되었습니다.

따라서 에이전트 중심 (agentic) 작업이나 CLI 비중이 높은 작업의 경우, 두 가지 평범한 습관이 비용 결정 요소가 됩니다. 바로 기본으로 설정하는 모델과 세션을 얼마나 오래 유지하느냐입니다. 하루 종일 이어지는 광범위한 에이전트 세션은 이제 결과뿐만 아니라 그 길이에 비례하는 비용을 수반하게 됩니다.

무엇이 "비싼" 비용을 만드는가

포함된 크레딧 풀 (included pools)은 실제 에이전트 사용량과 비교하기 전까지는 넉넉하게 느껴집니다. GitHub 커뮤니티 스레드에서 한 Pro+ 사용자는 평범한 개발 업무 하루 동안 약 360 크레딧을 사용했다고 보고했으며, 일반적인 한 달을 보낼 경우 포함된 7,000 크레딧을 훨씬 초과할 것으로 예상했습니다.

이는 하나의 워크로드(workload)일 뿐 벤치마크는 아니며, 얼마나 한계치에 근접할지는 귀하의 일과가 얼마나 에이전트 중심적인지에 따라 전적으로 달라집니다. 중요한 신호는 숫자가 아니라 그 형태입니다. 새로운 시스템 하에서 평범한 하루는 일정량의 크레딧 비용을 발생시키며, 에이전트 중심의 작업의 경우 그 비용이 월간 풀 (monthly pool)이 암시하는 것보다 더 빠르게 상승할 수 있습니다.

새로운 가드레일, 그리고 이중 과금

GitHub은 이번 전환과 함께 한도 도달 시 작동하는 하드 스톱 (hard stop) 기능과 월간 크레딧 소진 현황을 보여주는 사용량 보기 (usage view)를 포함한 예산 제어 기능을 출시했습니다. 또한 종량제 (pay-as-you-go) 경로도 제공되므로, 포함된 크레딧이 소진된 후 업그레이드를 강요받는 대신 현재 플랜을 유지하며 계속 작업할 수 있습니다.

팀들이 주의 깊게 살펴봐야 할 문제는 다음과 같습니다: Copilot 코드 리뷰(code review)가 에이전트 기반 아키텍처(agentic architecture)로 이동했으며, 6월 1일부로 프라이빗 리포지토리(private repositories)에서는 AI 크레딧(AI Credits) 외에 GitHub Actions 분(minutes)을 소모하게 됩니다. 이제 단일 풀 리퀘스트(pull request) 리뷰가 모델 비용과 러너 분(runner minutes)이라는 두 가지 청구 항목에 영향을 줄 수 있습니다. 퍼블릭 리포지토리(Public repos)는 기존의 무료 Actions 분을 그대로 유지합니다.

남겨진 질문

더 저렴해질지 혹은 더 비싸질지는 단정 지을 수 없습니다. 자동 완성(autocomplete) 위주의 사용자들에게는 비용이 일정할 것입니다. 하지만 에이전트 중심의 CLI 사용자들에게는 이제 세션(session)을 얼마나 강도 높게 실행하는지, 어떤 모델을 사용하는지에 따라 비용이 추적되므로, 사용자의 절제력에 따라 결과가 달라질 수 있습니다.

주시해야 할 두 가지 사항이 있습니다. 가격 차이는 작업에 적합한 모델을 매칭하는 것에 보상을 주므로, 의도적인 기본 모델 설정과 선택적인 모델 업그레이드는 이제 품질 전략뿐만 아니라 비용 전략이 됩니다. 그리고 예산 상한선(budget hard stop) 설정은 예상치 못한 비용 폭탄을 막는 가장 깔끔한 방어책이며, 이는 필요로 하기 전(after)보다 필요하기 전(before)에 미리 설정해 두는 것이 좋습니다.

이 밑바탕에 깔린 패턴은 GitHub가 공개적으로 밝히고 있는 것과 같습니다: 에이전트 기반 코딩(agentic coding)에는 이제 클라우드 경제학(cloud economics)이 결합되었습니다. 터미널(terminal)이 이를 가장 먼저 체감하게 될 것인데, 왜냐하면 터미널은 길고 자율적이며 토큰 소모가 많은(token-hungry) 세션이 실제로 실행되는 곳이기 때문입니다.

_출처: GitHub의 공지