【2026년 6월~】 GitHub Copilot이 종량제로 변경된다. AI 크레딧 시대의 비용 절약술 정리

「어, Copilot의 과금 체계가 바뀐다고?」

GitHub Copilot이 기존의 **프리미엄 요청제(Premium Request, 횟수 기반)**에서, **2026년 6월 1일에 종량제(Token-based, 토큰 기반)**로 이행합니다.

솔직히 말해서, "횟수제가 더 이해하기 쉬웠는데..."라고 생각하는 분들도 많을 것이라 생각합니다. 하지만 구조를 이해하면, 사용 방법에 따라 비용을 상당히 억제할 수 있다는 것을 알 수 있습니다!

이 기사에서는 새로운 과금 구조를 대략적으로 해설하면서, 컨텍스트(Context)와 토큰(Token)을 줄여 현명하게 사용하는 방법을 국내외 커뮤니티에서 화제가 되고 있는 방식까지 포함하여 정리했습니다.

✅ 새로운 과금 단위 「AI 크레딧 (AI Credit)」의 구조
✅ 플랜별 포함 크레딧량과 실제 비용 체감
✅ 모델별 비용 비교 (어떤 모델이 저렴한가)
✅ 토큰·컨텍스트를 줄이는 구체적인 절약술
✅ 해외 커뮤니티에서 화제인 「현명한 사용법」 정리

지금까지는 **프리미엄 요청(PRU)**이라는 「횟수」로 카운트했습니다. 모델에 따라 1배~15배의 곱셈이 적용되는 구조였습니다.

새로운 과금은 GitHub AI 크레딧이라는 단위로 바뀝니다.

1 AI 크레딧 = $0.01 USD

비용은 「모델 × 사용한 토큰 수」로 결정됩니다.

토큰이란 모델에 전달되는 텍스트 조각 같은 것입니다. 「입력 토큰 (Input Token, 당신이 보내는 내용)」, 「출력 토큰 (Output Token, 모델이 반환하는 내용)」, 「캐시 토큰 (Cache Token, 재사용되는 컨텍스트)」의 3종류가 있으며, 각각 서로 다른 단가가 적용됩니다.

종량제의 중요한 포인트는, 「몇 번 물어봤는가」보다 「얼마나 긴 대화를 나누었는가」가 비용에 직결된다는 점입니다.

2026년 6월 이후의 개인 플랜 포함 크레딧은 다음과 같습니다.

플랜	월간 요금	베이스 크레딧	플렉스 (Flex)	합계
Copilot Free	무료	—	—	소량 (코드 보완 2,000회)
Copilot Pro	$10	1,000	500	1,500
Copilot Pro+	$39	3,900	3,100	7,000
Copilot Max	$100	10,000	10,000	20,000

플렉스분은 매달 변동될 가능성이 있는 추가 버퍼입니다 (AI 경제 상황에 따라 조정된다고 GitHub은 설명하고 있습니다).

포함 크레딧을 다 쓰면 $0.01/크레딧으로 추가 구매할 수 있습니다 (Free 플랜은 불가). 예산 상한을 설정하여 과다 사용을 방지할 수도 있습니다!

코드의 인라인 보완 (Inline Completion, 회색 제안)과 Next Edit Suggest는 계속해서 무제한·무료입니다. 크레딧을 소비하는 것은 Chat, Agent Mode, CLI, Cloud Agent 등입니다.

새로운 과금제에서는 모델 선택이 비용에 직격탄을 줍니다. 주요 모델의 대략적인 비용 체감은 다음과 같습니다 (단위: 100만 토큰당 USD).

모델	유형	입력	캐시	출력	비용 체감
GPT-5 mini	경량	$0.25	$0.025	$2.00	⭐ 매우 저렴
Gemini 3 Flash	경량	$0.50	$0.05	$3.00	⭐ 매우 저렴
Raptor mini (GitHub 독자 모델)	경량	$0.25	$0.025	$2.00	⭐ 매우 저렴
Claude Haiku 4.5	범용	$1.00	$0.10	$5.00	✅ 저렴
GPT-4.1	범용	$2.00	$0.50	$8.00	✅ 표준
Gemini 3.1 Pro	강력	$2.00	$0.20	$12.00	💰 높음
Claude Sonnet 4.6	범용	$3.00	$0.30	$15.00	💰 높음
GPT-5.4	강력	$2.50	$0.25	$15.00	💰 높음
Claude Opus 4.7	최강	$5.00	$0.50	$25.00	💸 매우 높음
GPT-5.5	최강	$5.00	$0.50	$30.00	💸 매우 높음

참고로 GPT-5 mini와 Raptor mini는 **인클루드 모델 (Include Model, 추가 비용 0)**로서 특별 대우를 받습니다. Copilot Pro의 1,500 크레딧 = $15이므로, GPT-5 mini로 100만 토큰을 생성하더라도 크레딧을 다 쓰지 못한다는 계산이 나옵니다. 솔직히 경량 모델로 충분한 작업은 점점 GPT-5 mini에게 맡기는 것이 현명하다고 생각합니다!

가장 효과가 큰 절약술입니다.

"주석 좀 써줘", "변수명 어때?"와 같은 가벼운 태스크에 GPT-5.5를 사용하는 것은 아깝습니다.

태스크 종류	권장 모델
간단한 질문 · 주석 생성 · 짧은 보완	GPT-5 mini / Gemini 3 Flash
...

해외 커뮤니티에서 자주 언급되는 전략은 **「Tier 1 → 안 되면 Tier 2로 승격」**입니다. 먼저 경량 모델로 시도해 보고, 해결되지 않으면 강력한 모델로 전환하는 흐름으로 사용하면 비용을 억제하기 쉽습니다!

종량제(Pay-as-you-go)에서 은근히 영향을 미치는 것이 바로 대화의 길이입니다.

채팅 히스토리가 길어질수록 "입력 토큰 (Input Token)"이 늘어납니다. 30턴 동안 이어진 대화의 31번째 턴에서는 이전 30턴 전체가 컨텍스트 (Context)로 전송됩니다. 이 부분이 꽤 치명적입니다.

실천적인 대책:

같은 주제가 일단락되면
새로운 채팅을 시작한다 - GitHub.com의 Copilot Chat에는 「스레드 종료」 기능이 있음
VS Code에서는
Ctrl+L

으로 대화를 리셋 (윈도우 타이틀 오른쪽의 휴지통 아이콘으로도 가능)

「1 태스크 1 세션」으로 사용하는 것이 해외에서 권장되는 방식입니다. 세션을 넘기면 이전 문맥이 이어지지 않는 만큼, 컨텍스트가 늘어나는 것을 방지할 수 있습니다.

이것은 놓치기 쉬운 부분이지만, 코드를 작성할 때는 가급적 Chat을 사용하지 않고 인라인 보완 (Inline Completion)에 맡긴다는 의식이 중요합니다.

인라인 보완과 넥스트 에디트 서제스트 (Next Edit Suggest)는 AI 크레딧을 소비하지 않습니다. 과금되는 것은 Chat으로 보낸 메시지뿐입니다.

"이 부분의 로직을 작성해줘"라고 Chat으로 부탁하는 것보다, 코드를 직접 쓰기 시작하여 보완 기능을 활용하는 것이 비용이 0입니다! 에디터 상에서 조금만 써 내려가면, 의외로 원하는 코드가 나옵니다.

한 번의 상호작용으로 답이 나오면 그만큼 저렴해집니다. 「전제를 공유하는 질문」을 매번 주고받는 상황을 없애는 것이 목표입니다.

추천 구성:

.github/
copilot-instructions.md ← 프로젝트의 전제 · 규칙 · 스택
skills/
...

.github/copilot-instructions.md에 프로젝트의 기술 스택이나 코딩 규칙을 적어두면, 매번 "이 프로젝트는 TypeScript로~"라고 설명할 필요가 없어집니다.

SKILL.md는 더욱 심화된 절차서로, "Azure Bicep 리뷰를 부탁할 때", "Qiita 기사를 쓸 때"와 같이 구분해서 사용하면 편리합니다.

이 방법은 Agent Skills Ninja (yamapan.agent-skill-ninja)라는 VS Code 확장 프로그램으로 일원 관리할 수 있습니다 (별도 기사에서 자세히 다루었습니다!).

▼ Agent Skills Ninja 다운로드는 이쪽

Agent Skills Ninja - VS Code Marketplace
Agent Resources Ninja - VS Code Marketplace (자매 확장. 에이전트, 프롬프트, MCP 등도 관리 가능)

또는 VS Code의 커맨드 팔레트(Command Palette)에서:

ext install yamapan.agent-skill-ninja
ext install yamapan.agent-resources-ninja

「스킬 관리 도구」로 소개되는 경우가 많은 Agent Skills Ninja이지만, 사실 토큰 절약에도 효과가 있는 설정이 몇 가지 있습니다.

Agent Skills Ninja가 AGENTS.md에 작성하는 스킬 목록의 형식을 변경할 수 있습니다.

{
"skillNinja.outputFormat": "compact"
}

포맷	스킬당 글자 수	특징
`full`	약 200자	IMPORTANT 프롬프트 + 상세 테이블
`compact`	약 100자	압축 인덱스 (토큰 절약!)
`legacy`	최소	IMPORTANT 없음 (하위 호환용)

스킬을 10개 넣었을 경우, full에서 compact로 전환하는 것만으로도 instruction 파일의 스킬 목록 부분이 약 절반으로 줄어듭니다. 매번 채팅할 때 해당 파일이 컨텍스트 (Context)에 포함된다면, 대화할 때마다 절약이 쌓이는 구조입니다!

Agent Resources Ninja와 함께 사용 중이라면, resourceNinja.kindsExcluded를 통해 블록에 포함할 종류를 좁힐 수 있습니다.

{
"resourceNinja.kindsExcluded": ["agent", "instruction"]
}

Agent 정의나 Instructions를 instruction 블록에서 제외함으로써 AGENTS.md의 크기를 억제할 수 있습니다. "매번 모든 리소스를 읽을 필요는 없다"는 태스크가 많다면 시도해 볼 가치가 있습니다.

SKILL.md에 ## When to Use (언제 사용하는가) 섹션을 작성해 두면, 에이전트가 "이 태스크에는 이 스킬이 불필요하다"라고 판단하여 스킬의 내용을 읽으러 가지 않는 경우가 있습니다.

## When to Use
Azure Bicep 템플릿 작성 및 리뷰를 요청받았을 때.
다른 IaC (Terraform 등)나 일반적인 코딩에는 사용하지 않음.

스킬을 전부 읽지 않아도 되는 만큼, 1턴당 입력 토큰이 늘어나는 것을 방지할 수 있습니다.

추상적이고 긴 질문은 긴 답변 = 높은 출력 비용을 발생시킵니다.

❌ "이 코드를 보고 전체적으로 개선할 수 있는 부분을 알려줘.
성능이라든가, 가독성이라든가, 보안이라든가
여러 가지를 봐줬으면 좋겠어"
...

"일 질문 일 목적"으로 주고받으면 출력이 짧아져 비용도 낮아집니다. 해외 Copilot 사용자들 사이에서는 "Atomic prompting" (원자적 프롬프트) 라고 불리는 방식으로, 한 번에 여러 가지를 부탁하지 않는 것이 포인트입니다!

비용 의식을 갖기 위해서는 먼저 자신이 얼마나 사용하고 있는지 아는 것이 중요합니다.

GitHub.com → Settings → Copilot → Usage에서 사용량을 확인할 수 있습니다.

premium request analytics page에서 CSV 다운로드도 가능합니다.
Billing Preview Tool에 업로드하면 기존 과금과 신규 과금을 비교할 수 있습니다.

이전하기 전에 한 번 체크해 보면 "의외로 나는 이 모델을 너무 많이 쓰고 있구나"라는 깨달음을 얻을 수 있어 흥미롭습니다.

Reddit이나 GitHub Discussions에서 최근 자주 보이는 컨셉입니다.

큰 파일을 #file로 통째로 첨부하지 않기 - "관련 있는 클래스만", "이 메서드만" 선택해서 보내기
.copilotignore나 files.exclude로 불필요한 파일을 컨텍스트에서 제외하기

에디터가 자동으로 컨텍스트에 포함하는 범위를 좁힘으로써, 자신도 모르는 사이에 토큰을 소비하는 상황을 방지할 수 있습니다.

VS Code 1.120 이후 버전에서는 Auto 모델을 사용하면 Copilot이 태스크의 난이도를 보고 자동으로 모델을 선택해 줍니다.

# settings.json
{
"github.copilot.chat.models.preferred": "auto"
...
}

auto 설정을 사용하면 Copilot 스스로가 단순한 태스크에는 경량 모델을, 복잡한 태스크에는 강력한 모델을 할당합니다. 수동으로 모델을 계속 선택하는 것이 번거로운 사람에게 적합합니다!

Anthropic 모델 (Claude 계열)은 캐시 토큰 (Cache Token) 가격이 상당히 저렴합니다 (입력의 약 1/10).

동일한 프로젝트, 동일한 instruction 파일을 반복해서 사용하는 대화에서는 캐시가 효과적으로 작동하므로, 세션을 너무 자주 리셋하면 오히려 캐시를 사용할 수 없게 됩니다. 균형이 필요합니다.

긴 instruction (지시사항) 파일을 가지고 있는 경우에는, 동일한 프로젝트 내에서 대화를 계속하는 것이 캐시 (Cache)가 적용되어 비용 절약에 도움이 될 수 있습니다.

Agent Mode (에이전트 모드)는 매우 편리하지만, 내부적으로 여러 번의 모델 호출 (Model Call)이 발생합니다.

복잡한 태스크 (Task)를 에이전트에게 통째로 맡기면, 도구 호출 (Tool Call) · 코드 생성 · 확인 · 수정... 등의 루프 (Loop)가 계속되어 비용이 쌓이게 됩니다.

해외의 "Responsible Copilot Usage" 계열 가이드에서 권장하는 방식은 다음과 같습니다:

Chat (대화)를 통해 설계를 확정한 후, Agent Mode에 구현을 요청하기 - 태스크를 작게 분할하여 한 단계씩 요청하기

"큰 일을 한 번에 맡기는" 것보다 "작게 나누어 확인하며 진행하는" 편이 결과적으로 비용이 더 저렴한 경우가 많습니다.

포함된 크레딧을 모두 사용한 후에도 자동으로 과금이 계속되는 것이 걱정된다면, **추가 사용 예산 상한 (Spending Limit)**을 설정할 수 있습니다.

Settings

→ Billing & plans

→ Copilot의 Spending limit

에서 달러($) 단위로 상한을 설정할 수 있습니다 ($0로 설정하면 포함 크레딧 초과 시 사용이 중단됩니다).

개인 이용자라면 처음에는 $0로 설정해 두었다가, 필요할 때마다 올리는 것이 안심됩니다!

종량제 (Pay-as-you-go)로의 전환은 "사용하면 사용할수록 지불하는" 구조가 되므로 처음에는 불안할 수도 있습니다. 하지만 "무엇에 대해 지불하고 있는가"가 명확해진다는 점에서는 기존 과금 방식보다 이해하기 쉽다고도 할 수 있습니다.

절약 포인트를 정리하면 다음과 같습니다:

모델은 용도에 따라 구분해서 사용하기 (가벼운 태스크는 GPT-5 mini로도 충분합니다!) -
대화는 짧게 유지하기 (1 태스크 1 세션이 기본) -
인라인 보완 (Inline Completion)은 무료 (적극적으로 활용하기) -
instruction 파일을 정비하기 (왕복 횟수 줄이기) -
질문은 구체적으로 (원자적인 프롬프트) -
대시보드에서 사용량을 정기적으로 체크하기

처음부터 전부 다 하려고 하면 힘들 수 있으므로, 우선 모델의 구분 사용과 대화의 길이를 의식하는 것만으로도 변화가 생길 것이라고 생각합니다. 그 외에는 auto 모델에 맡겨버리는 것도 전혀 괜찮은 방법입니다!

저도 아직 시도하면서 최적의 방법을 찾고 있는 중이므로, 만약 "이 방법이 효과적이었다!" 하는 것이 있다면 꼭 댓글로 알려주시면 감사하겠습니다🙇‍♂️

이 기사에서 소개한 Agent Skills Ninja / Agent Resources Ninja를 사용한 스킬 관리 방법은 별도의 기사에 자세히 적어두었습니다. 컨텍스트 (Context) 설계부터 AGENTS.md의 자동 업데이트까지 사용법을 정리해 두었으니 참고해 보세요!

【2026년 6월~】 GitHub Copilot이 종량제로 변경된다. AI 크레딧 시대의 비용 절약술 정리

요약

핵심 포인트

▼ Agent Skills Ninja 다운로드는 이쪽

댓글