
Claude Code × OpenRouter :free 모델로 AI 코딩 지원 비용을 약 90% 절감한 5가지 설정
요약
Claude Code의 API 비용을 절감하기 위해 OpenRouter의 :free 모델을 활용하는 설정 방법을 소개합니다. 환경 변수 설정과 태스크 분류를 통해 품질을 유지하며 비용을 약 90% 절감할 수 있습니다.
핵심 포인트
- ANTHROPIC_BASE_URL 설정을 통해 OpenRouter로 라우팅 가능
- 태스크 성격(사고형 vs 정형 보완형)에 따른 모델 분리 운용
- CLAUDE.md를 활용한 프로젝트별 모델 사용 지침 정의
- Qwen, Gemini, Llama 등 다양한 무료 모델 활용 가능
- Claude Code의 백엔드를 OpenRouter의
:free모델로 전환하는 것만으로 API 비용을 거의 제로에 가깝게 줄일 수 있습니다 - 모델 선택, 프롬프트 설계, 태스크 분류의 3개 축을 통해 품질을 유지하면서 저비용 운용이 가능합니다 - 「사고형 태스크」와 「정형 보완형 태스크」를 나누는 라우팅이 핵심입니다
Claude Code를 일상적인 코딩 지원에 사용하기 시작하면 곧바로 직면하게 되는 것이 API 비용 문제입니다. Claude 3.7 Sonnet을 풀 활용하면, 하루 개발 작업에서 수 달러~십수 달러의 과금이 발생하는 것도 드문 일이 아닙니다.
OpenRouter는 여러 LLM 프로바이더를 통합 API로 호출할 수 있는 게이트웨이로, 모델명 끝에 :free를 붙이면 무료 범위 내에서 호출할 수 있는 모델이 다수 준비되어 있습니다 (2026년 시점).
본 기사에서는 Claude Code의 설정 파일과 환경 변수를 사용하여 OpenRouter :free 모델로 라우팅하는 구성을 해설합니다. 사내 코드는 일절 포함하지 않으며, 공식 문서와 OSS의 일반 지식만을 바탕으로 합니다.
| 도구 | 역할 |
|---|---|
| Claude Code | Anthropic 공식 CLI 기반 AI 코딩 지원 도구 |
| OpenRouter | 멀티 LLM 게이트웨이. OpenAI 호환 API를 제공 |
:free 모델 | OpenRouter가 무료 범위로 제공하는 모델군 (Rate Limit 있음) |
Claude Code는 내부적으로 Anthropic Messages API를 호출하고 있지만, 환경 변수 ANTHROPIC_BASE_URL을 설정함으로써 호환 API 엔드포인트로의 라우팅이 가능합니다 (공식 문서에 기재된 기능).
# .env.local 또는 shell 설정 파일에 기술
export ANTHROPIC_BASE_URL="https://openrouter.ai/api/v1"
export ANTHROPIC_API_KEY="<your-openrouter-api-key>"
⚠️ API 키 값은 절대로 Git에 커밋하지 마세요.
.gitignore에 추가하는 것을 철저히 합시다.
OpenRouter의 API 키는 openrouter.ai/keys에서 발행할 수 있습니다 (무료 계정으로 즉시 발행 가능).
:free 모델은 Rate Limit(속도 제한)이 엄격하지만, 태스크의 성질에 따라 나누어 사용함으로써 병목 현상을 회피할 수 있습니다.
태스크 분류 기준
■ :free 모델로 충분한 태스크
- 코멘트·문서 생성
...
2026년 5월 시점에서 Claude Code와의 궁합이 좋은 :free 모델 예시:
| 모델 ID (OpenRouter) | 특징 |
|---|---|
qwen/qwen3-235b-a22b:free | 다국어 대응·코드 보완에 강함 |
google/gemini-2.0-flash-exp:free | 고속·컨텍스트 길이가 김 |
meta-llama/llama-4-maverick:free | 영어 코드에 강함·Llama 4 계열 최대 |
deepseek/deepseek-chat-v3-0324:free | 코드 생성 정밀도가 높다고 평가됨 |
mistralai/mistral-small-3.2-24b-instruct:free | 경량·보완 계열에 최적 |
📌 이용 가능한 모델은 openrouter.ai/models에서 필터
Free를 선택하면 목록을 볼 수 있습니다. 라인업은 빈번하게 업데이트되므로 정기적인 확인을 권장합니다.
Claude Code는 프로젝트 루트의 CLAUDE.md를 읽어 동작 지침으로 삼습니다. 여기에 **「이 프로젝트에서는 비용 억제를 위해 :free 모델을 우선한다」**는 취지를 적어두면, Claude Code 스스로가 모델 선택 판단에 사용합니다.
# CLAUDE.md (프로젝트용·공개 리포지토리용 샘플)
## 모델 사용 정책
이 프로젝트에서는 OpenRouter :free 모델을 기본으로 사용합니다.
...
CLI에서 직접 모델을 지정하고 싶다면 --model 플래그를 사용할 수 있습니다.
:free 모델로 실행
claude --model qwen/qwen3-235b-a22b:free
태스크가 복잡하다면 유료 모델로 승격
...
셸 함수(Shell function)로 에일리어스(Alias)를 정의해 두면 편리합니다:
# ~/.bashrc 또는 ~/.zshrc
# 경량 태스크용 (무료)
alias cc-free='claude --model qwen/qwen3-235b-a22b:free'
...
:free
모델은 분당 요청 수(RPM)에 상한이 있습니다. CI 등에서 여러 파일을 연속적으로 처리할 경우, 429 에러 발생 시 **지수 백오프 (Exponential Backoff)**로 재시도하는 셸 래퍼(Shell wrapper)를 사이에 두면 안정적입니다.
#!/usr/bin/env bash
# claude-with-backoff.sh — :free 모델용 지수 백오프 래퍼
MAX_RETRIES=5
...
chmod +x claude-with-backoff.sh
# 사용법
./claude-with-backoff.sh --model qwen/qwen3-235b-a22b:free \
...
| 구성 | 월간 비용 예상 (개인 개발·중규모) |
|---|---|
| Claude Sonnet 전체 사용 | $30 〜 $80 |
| ... | |
| ※ 위 수치는 어디까지나 개략적인 계산입니다. 실제 비용은 프로젝트 규모, 요청 빈도, 모델의 컨텍스트 길이(Context length) 소비량에 따라 크게 변동됩니다. OpenRouter 대시보드의 Usage 탭에서 수시로 확인하십시오. |
OpenRouter는 OpenAI 호환 엔드포인트(Endpoint)를 제공하지만, Anthropic의 독자적인 파라미터(thinking, betas 헤더 등)는 일부 모델에서 지원되지 않습니다. Claude Code가 내부적으로 확장 파라미터를 보낼 경우, 폴백(Fallback)되거나 무시됩니다.
→ 대책: 확장 기능(Extended Thinking 등)을 사용하는 상황에서는 ANTHROPIC_BASE_URL을 리셋하여 본래의 Anthropic 엔드포인트로 되돌린다.
# Anthropic 본래의 서비스를 사용하고 싶을 때만 일시적으로 덮어쓰기
ANTHROPIC_BASE_URL="" claude --model claude-sonnet-4-5 "아키텍처를 설계해줘"
:free
할당량은 OpenRouter의 프로모션 전략이며, 예고 없이 종료되거나 레이트(Rate)가 변경될 수 있습니다.
→ 대책: 사용 모델을 CLAUDE.md 또는 설정 파일에 일원 관리하여 전환 비용을 최소화한다.
:free
모델에 따라 컨텍스트 윈도우(Context window)가 8K~32K로 짧은 경우가 있습니다. 큰 파일을 통째로 넣으면 중간에 끊길 수도 있습니다.
→ 대책: claude --file로 전달하기 전에 파일을 함수 단위로 분할하거나, 방대한 파일은 유료 모델로 라우팅(Routing)한다.
| 포인트 | 내용 |
|---|---|
| ① 엔드포인트 전환 | ANTHROPIC_BASE_URL로 OpenRouter를 향하게 설정 |
| ② 모델 선정 | 태스크 복잡도에 따라 라우팅 분리 |
| ③ CLAUDE.md 활용 | 프로젝트 정책으로 명문화 |
| ④ 에일리어스 | cc-free / cc-pro로 원커맨드 전환 |
| ⑤ 백오프 | 429 에러에 대비한 재시도 래퍼 |
Claude Code와 OpenRouter :free 모델의 조합은 개인 개발자나 스타트업의 초기 단계에서 품질과 비용의 균형을 맞추는 현실적인 해답입니다. 우선 ANTHROPIC_BASE_URL 한 줄만 바꿔서 시도해 보세요.
- Claude Code 공식 문서
- OpenRouter 공식 문서
- OpenRouter 모델 목록 (Free 필터)
- OpenRouter API Reference
- Qwen3 기술 보고서 (Hugging Face)
- DeepSeek-V3 기술 보고서
✍️ 본 기사 저자: 합동회사 지모랩 (Jimolab LLC)
지모랩은 하치오지를 거점으로 AI를 활용한 SaaS를 다수 개발하고 있습니다. 본 기사의 기술 검증 또한 그러한 개발 과정의 부산물입니다.
- 🌐 공식 사이트: https://locallab.jp
- 🔍 AI SEO 최적화 SaaS: lookupai.jp
- 📺 YouTube: @locallab_llc
- ✉️ 문의하기: info@locallab.jp
관심이 생기셨다면, 꼭 각 SNS 팔로우도 부탁드립니다!
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기