본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 15. 13:54

Claude Code × OpenRouter :free 모델로 AI 코딩 지원 비용을 약 90% 절감한 5가지 설정

요약

Claude Code의 API 비용을 절감하기 위해 OpenRouter의 :free 모델을 활용하는 설정 방법을 소개합니다. 환경 변수 설정과 태스크 분류를 통해 품질을 유지하며 비용을 약 90% 절감할 수 있습니다.

핵심 포인트

  • ANTHROPIC_BASE_URL 설정을 통해 OpenRouter로 라우팅 가능
  • 태스크 성격(사고형 vs 정형 보완형)에 따른 모델 분리 운용
  • CLAUDE.md를 활용한 프로젝트별 모델 사용 지침 정의
  • Qwen, Gemini, Llama 등 다양한 무료 모델 활용 가능
  • Claude Code의 백엔드를 OpenRouter의 :free 모델로 전환하는 것만으로 API 비용을 거의 제로에 가깝게 줄일 수 있습니다 - 모델 선택, 프롬프트 설계, 태스크 분류의 3개 축을 통해 품질을 유지하면서 저비용 운용이 가능합니다
  • 「사고형 태스크」와 「정형 보완형 태스크」를 나누는 라우팅이 핵심입니다

Claude Code를 일상적인 코딩 지원에 사용하기 시작하면 곧바로 직면하게 되는 것이 API 비용 문제입니다. Claude 3.7 Sonnet을 풀 활용하면, 하루 개발 작업에서 수 달러~십수 달러의 과금이 발생하는 것도 드문 일이 아닙니다.

OpenRouter는 여러 LLM 프로바이더를 통합 API로 호출할 수 있는 게이트웨이로, 모델명 끝에 :free를 붙이면 무료 범위 내에서 호출할 수 있는 모델이 다수 준비되어 있습니다 (2026년 시점).

본 기사에서는 Claude Code의 설정 파일과 환경 변수를 사용하여 OpenRouter :free 모델로 라우팅하는 구성을 해설합니다. 사내 코드는 일절 포함하지 않으며, 공식 문서와 OSS의 일반 지식만을 바탕으로 합니다.

도구역할
Claude CodeAnthropic 공식 CLI 기반 AI 코딩 지원 도구
OpenRouter멀티 LLM 게이트웨이. OpenAI 호환 API를 제공
:free 모델OpenRouter가 무료 범위로 제공하는 모델군 (Rate Limit 있음)

Claude Code는 내부적으로 Anthropic Messages API를 호출하고 있지만, 환경 변수 ANTHROPIC_BASE_URL을 설정함으로써 호환 API 엔드포인트로의 라우팅이 가능합니다 (공식 문서에 기재된 기능).

# .env.local 또는 shell 설정 파일에 기술
export ANTHROPIC_BASE_URL="https://openrouter.ai/api/v1"
export ANTHROPIC_API_KEY="<your-openrouter-api-key>"

⚠️ API 키 값은 절대로 Git에 커밋하지 마세요.

.gitignore에 추가하는 것을 철저히 합시다.

OpenRouter의 API 키는 openrouter.ai/keys에서 발행할 수 있습니다 (무료 계정으로 즉시 발행 가능).

:free 모델은 Rate Limit(속도 제한)이 엄격하지만, 태스크의 성질에 따라 나누어 사용함으로써 병목 현상을 회피할 수 있습니다.

태스크 분류 기준
■ :free 모델로 충분한 태스크
- 코멘트·문서 생성
...

2026년 5월 시점에서 Claude Code와의 궁합이 좋은 :free 모델 예시:

모델 ID (OpenRouter)특징
qwen/qwen3-235b-a22b:free다국어 대응·코드 보완에 강함
google/gemini-2.0-flash-exp:free고속·컨텍스트 길이가 김
meta-llama/llama-4-maverick:free영어 코드에 강함·Llama 4 계열 최대
deepseek/deepseek-chat-v3-0324:free코드 생성 정밀도가 높다고 평가됨
mistralai/mistral-small-3.2-24b-instruct:free경량·보완 계열에 최적

📌 이용 가능한 모델은 openrouter.ai/models에서 필터
Free를 선택하면 목록을 볼 수 있습니다. 라인업은 빈번하게 업데이트되므로 정기적인 확인을 권장합니다.

Claude Code는 프로젝트 루트의 CLAUDE.md를 읽어 동작 지침으로 삼습니다. 여기에 **「이 프로젝트에서는 비용 억제를 위해 :free 모델을 우선한다」**는 취지를 적어두면, Claude Code 스스로가 모델 선택 판단에 사용합니다.

# CLAUDE.md (프로젝트용·공개 리포지토리용 샘플)
## 모델 사용 정책
이 프로젝트에서는 OpenRouter :free 모델을 기본으로 사용합니다.
...

CLI에서 직접 모델을 지정하고 싶다면 --model 플래그를 사용할 수 있습니다.

:free 모델로 실행

claude --model qwen/qwen3-235b-a22b:free

태스크가 복잡하다면 유료 모델로 승격

...

셸 함수(Shell function)로 에일리어스(Alias)를 정의해 두면 편리합니다:

# ~/.bashrc 또는 ~/.zshrc
# 경량 태스크용 (무료)
alias cc-free='claude --model qwen/qwen3-235b-a22b:free'
...

:free

모델은 분당 요청 수(RPM)에 상한이 있습니다. CI 등에서 여러 파일을 연속적으로 처리할 경우, 429 에러 발생 시 **지수 백오프 (Exponential Backoff)**로 재시도하는 셸 래퍼(Shell wrapper)를 사이에 두면 안정적입니다.

#!/usr/bin/env bash
# claude-with-backoff.sh — :free 모델용 지수 백오프 래퍼
MAX_RETRIES=5
...
chmod +x claude-with-backoff.sh
# 사용법
./claude-with-backoff.sh --model qwen/qwen3-235b-a22b:free \
...
구성월간 비용 예상 (개인 개발·중규모)
Claude Sonnet 전체 사용$30 〜 $80
...
※ 위 수치는 어디까지나 개략적인 계산입니다. 실제 비용은 프로젝트 규모, 요청 빈도, 모델의 컨텍스트 길이(Context length) 소비량에 따라 크게 변동됩니다. OpenRouter 대시보드의 Usage 탭에서 수시로 확인하십시오.

OpenRouter는 OpenAI 호환 엔드포인트(Endpoint)를 제공하지만, Anthropic의 독자적인 파라미터(thinking, betas 헤더 등)는 일부 모델에서 지원되지 않습니다. Claude Code가 내부적으로 확장 파라미터를 보낼 경우, 폴백(Fallback)되거나 무시됩니다.

대책: 확장 기능(Extended Thinking 등)을 사용하는 상황에서는 ANTHROPIC_BASE_URL을 리셋하여 본래의 Anthropic 엔드포인트로 되돌린다.

# Anthropic 본래의 서비스를 사용하고 싶을 때만 일시적으로 덮어쓰기
ANTHROPIC_BASE_URL="" claude --model claude-sonnet-4-5 "아키텍처를 설계해줘"

:free

할당량은 OpenRouter의 프로모션 전략이며, 예고 없이 종료되거나 레이트(Rate)가 변경될 수 있습니다.

대책: 사용 모델을 CLAUDE.md 또는 설정 파일에 일원 관리하여 전환 비용을 최소화한다.

:free

모델에 따라 컨텍스트 윈도우(Context window)가 8K~32K로 짧은 경우가 있습니다. 큰 파일을 통째로 넣으면 중간에 끊길 수도 있습니다.

대책: claude --file로 전달하기 전에 파일을 함수 단위로 분할하거나, 방대한 파일은 유료 모델로 라우팅(Routing)한다.

포인트내용
① 엔드포인트 전환ANTHROPIC_BASE_URL로 OpenRouter를 향하게 설정
② 모델 선정태스크 복잡도에 따라 라우팅 분리
③ CLAUDE.md 활용프로젝트 정책으로 명문화
④ 에일리어스cc-free / cc-pro로 원커맨드 전환
⑤ 백오프429 에러에 대비한 재시도 래퍼

Claude Code와 OpenRouter :free 모델의 조합은 개인 개발자나 스타트업의 초기 단계에서 품질과 비용의 균형을 맞추는 현실적인 해답입니다. 우선 ANTHROPIC_BASE_URL 한 줄만 바꿔서 시도해 보세요.

  • Claude Code 공식 문서
  • OpenRouter 공식 문서
  • OpenRouter 모델 목록 (Free 필터)
  • OpenRouter API Reference
  • Qwen3 기술 보고서 (Hugging Face)
  • DeepSeek-V3 기술 보고서

✍️ 본 기사 저자: 합동회사 지모랩 (Jimolab LLC)

지모랩은 하치오지를 거점으로 AI를 활용한 SaaS를 다수 개발하고 있습니다. 본 기사의 기술 검증 또한 그러한 개발 과정의 부산물입니다.

관심이 생기셨다면, 꼭 각 SNS 팔로우도 부탁드립니다!

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0