decolua/9router
요약
9Router는 AI 코딩 도구 사용 시 발생하는 토큰 낭비, 비용 문제, 서비스 중단 문제를 해결하는 통합 프록시 및 관리 시스템입니다. RTK(토큰 절감기)를 통해 도구 출력 내용을 압축하여 요청당 최대 40%의 토큰을 절약하고, 스마트한 자동 패백 기능을 구현하여 유료 구독에서 저렴하거나 무료 모델로 끊김 없이 전환합니다. 이 솔루션은 Claude Code, Copilot 등 수많은 AI 코딩 도구와 연결되어 비용 효율적이고 안정적인 개발 환경을 제공합니다.
핵심 포인트
- **토큰 절감 (RTK):** `git diff`, `grep` 등의 도구 출력을 압축하여 요청당 20-40%의 입력 토큰을 절약합니다.
- **자동 패백 및 구독 최대화:** 유료 구독 할당량이 소진되거나 속도 제한에 걸려도 자동으로 저렴하거나 무료 모델로 전환되어 코딩 중단이 없습니다.
- **유니버설 호환성:** Claude Code, Copilot, Cursor 등 40개 이상의 AI 제공자 및 수많은 CLI 도구와 통합하여 사용할 수 있습니다.
- **비용 효율적 관리:** 실시간 할당량 추적, 다중 계정 지원 등을 통해 API 비용 지출을 최적화합니다.
코딩을 멈추지 마세요. RTK + 자동 패백 (auto-fallback) 을 통해 무료 및 저렴한 AI 모델에서 20-40% 토큰 절감.
Claude Code, Cursor, Antigravity, Copilot, Codex, Gemini, OpenCode, Cline, OpenClaw... 등 모든 AI 코드 도구와 40+ AI 제공자 및 100+ 모델에 연결합니다.
🚀 빠른 시작 • 💡 기능 소개 • 📖 설치 방법 • 🌐 웹사이트
🇻🇳 베트남어 • 🇨🇳 중국어 • 🇯🇵 일본어
돈, 토큰 낭비 및 한계치 도달 방지:
- ❌ 구독 할당량이 매월 사용되지 않은 상태로 만료됨
- ❌ 속도 제한으로 코딩 중이 중단됨
- ❌ 도구 출력 (git diff, grep, ls...) 은 토큰 소모가 빠름
- ❌ 비싼 API ($20-50/월 제공자당)
- ❌ 제공자 간 수동 전환
9Router 는 이를 해결합니다:
- ✅ RTK 토큰 절감기- 도구 결과 내용 자동 압축, 요청당 20-40% 토큰 절감 - ✅
- ✅ 구독 최대화- 할당량 추적, 리셋 전 모든 부분 사용 - ✅
- ✅ 자동 패백- 구독 → 저렴한 → 무료, 다운타임 없음 - ✅
- ✅ 멀티 계정- 제공자별 계정에 라운드 로빈 적용 - ✅
- ✅ 유니버설- Claude Code, Codex, Cursor, Cline, 임의 CLI 도구와 작동
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, OpenClaw, Cursor, Cline...)
│ Tool │
...
1. 전역 설치:
npm install -g 9router
9router
🎉 http://localhost:20128 에서 대시보드 열림
2. 무료 제공자 연결 (가입 필요 없음):
대시보드 → 제공자 → Kiro AI(무료 Claude 무제한) 또는 OpenCode Free(인증 불필요) 연결 → 완료!
3. CLI 도구에서 사용:
Claude Code/Codex/OpenClaw/Cursor/Cline 설정:
엔드포인트: http://localhost:20128/v1
API 키: [대시보드에서 복사]
...
그만! 무료 AI 모델로 코딩 시작.
대안: 소스 코드에서 실행 (이 저장소):
이 저장소 패키지는 사설 (9router-app)
이므로 소스/Docker 실행은 예상되는 로컬 개발 경로입니다.
cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev
프로덕션 모드:
npm run build
PORT=20128 HOSTNAME=0.0.0.0 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run start
기본 URL:
-
대시보드:
http://localhost:20128/dashboard -
OpenAI 호환 API:
http://localhost:20128/v1
9Router 는 주요 AI 코딩 도구와 원활하게 작동합니다:
Kiro AIClaude 4.5 + GLM-5 + MiniMax
무제한 무료 |
OpenCode Free
인증 없음 • 자동 모델 가져오기
무제한 무료 |
Vertex AIGemini 3 Pro + GLM-5 + DeepSeek
$300 크레딧 무료 |
참고: iFlow, Qwen 과 Gemini CLI 무료 계층은 2026 년에 중단되었습니다. 대신 Kiro / OpenCode Free / Vertex 를 사용하세요.
OpenRouter
|
GLM
|
Kimi
|
MiniMax
|
OpenAI
|
Anthropic
|
Gemini
|
DeepSeek
|
Groq
|
xAI
|
Mistral
|
Perplexity
|
Together AI
|
Fireworks
|
Cerebras
|
Cohere
|
NVIDIA
|
SiliconFlow
|
...그리고 Nebius, Chutes, Hyperbolic 과 커스텀 OpenAI/Anthropic 호환 엔드포인트를 포함한 20 개 이상의 추가 제공자
| 기능 | 역할 | 중요성 |
|---|---|---|
| 🚀 RTK 토큰 저장기 (RTK ⭐40K) | ||
도구 출력 (git diff , grep , ls , tree ...) 을 LLM 에 보내기 전에 압축합니다 | ||
| 요청당 20-40% 입력 토큰 절약 | ||
| 🪨 Caveman 모드 (Caveman ⭐52K) | ||
| Caveman 스피크 프롬프트 주입 → LLM 은 간결한 답변, 기술적 내용은 유지 | 출력 토큰 최대 65% 절약 | |
| 🎯 스마트 3 계층 패러백 | ||
| 자동 라우팅: 구독 → 저렴 → 무료 | 코딩 중단 없이, 다운타임 제로 | |
| 📊 실시간 쿼타 추적 | ||
| 라이브 토큰 수 + 리셋 카운트다운 | 구독 가치 극대화 | |
| 🔄 포맷 번역 | ||
| OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro ↔ Vertex | 모든 CLI 도구와 작동 | |
| 👥 다중 계정 지원 | ||
| 제공자당 여러 계정 | 로드 밸런싱 + 중복 | |
| 🔄 자동 토큰 갱신 | ||
| OAuth 토큰 자동 갱신 | 수동 재 로그인 불필요 | |
| 🎨 커스텀 콤보 | ||
| 무제한 모델 조합 생성 | 패러백을 필요에 맞게 맞춤 | |
| 📝 요청 로깅 | ||
| 전부 요청/응답 로그를 포함한 디버그 모드 | 문제 해결 용이 | |
| 💾 클라우드 동기화 | ||
| 장치 간 설정 동기화 | 모든 곳에서 동일한 설정 | |
| 📊 사용 분석 | ||
| 토큰, 비용, 시간 경과에 따른 추이 추적 | 지출 최적화 | |
| 🌐 어디나 배포 | ||
| Localhost, VPS, Docker, Cloudflare Workers | 유연한 배포 옵션 |
📖 기능 상세
도구 출력 (git diff
\nls\n
\ntree\n
log dumps...) 는 종종 프롬프트 예산의 30~50% 를 차지합니다. RTK 는 이를 감지하고 요청이 LLM 에 도달하기 전에 지능적이고 손실 없는 압축을 적용합니다:
필터: git-diff\n, git-status\n, grep\n, find\n, ls\n, tree\n, dedup-log\n, smart-truncate\n, read-numbered\n, search-list
자동 감지: 설정 불필요 — RTK 는 각 tool_result 의 첫 1KB 를 확인하고 올바른 필터를 선택합니다.설계상 안전: 필터가 실패하거나 예외를 발생시키거나 출력을 더 크게 만들면 RTK 는 원본 텍스트를 조용히 유지합니다. 오류는 요청을 절대로 중단하지 않습니다.보편적: OpenAI, Claude, Gemini, Cursor, Kiro, OpenAI Responses 등 모든 형식에서 작동합니다. 이는 전에 형식 번역이 실행되기 전에 실행되기 때문입니다.
기본 ON: Dashboard → Endpoint 설정에서 언제든지 토글할 수 있습니다.
\nRTK 를 사용하지 않을 때: LLM 에 47K 토큰 전송\nRTK 사용 시: LLM 에 28K 토큰 전송 (40% 절감 · 동일한 컨텍스트 · 동일한 답변)\n
자동 회귀와 함께 조합을 생성하세요:
\n조합: "my-coding-stack"\n1. cc/claude-opus-4-6 (구독)\n2. glm/glm-4.7 (저렴한 백업, $0.6/1M)\n...\n
- 제공자별 토큰 소모량\n- 리셋 카운트 (5 시간, 일일, 주당)\n- 유료 등급 비용 추정\n- 월간 지출 보고서
형식 간 원활한 번역:
OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro ↔ Vertex ↔ Antigravity ↔ Ollama ↔ OpenAI Responses- 당신의 CLI 도구는 OpenAI 형식을 전송 → 9Router 는 번역 → 제공자는 원본 형식을 받습니다\n- 커스텀 OpenAI 엔드포인트를 지원하는 모든 도구와 함께 작동합니다
-
제공자별로 여러 계정 추가\n- 자동 라운드-robin 또는 우선순위 기반 라우팅\n- 한 계정이 할당량을 초과하면 다음 계정으로 회귀
-
OAuth 토큰은 만료되기 전에 자동으로 갱신됩니다\n- 수동 재 인증 불필요\n- 모든 제공자와 원활한 경험
-
무제한 모델 조합 생성\n- 구독, 저렴, 무료 등급 혼합\n- 조합에 이름을 붙어 쉽게 접근\n- 클라우드 동기화를 통해 기기 간 조합 공유
-
디버그 모드를 활성화하여 전체 요청/응답 로그 사용\n- API 호출, 헤더 및 페이로드 추적\n- 통합 문제 해결\n- 분석을 위해 로그 내보내기
-
제공자, 조합 및 설정을 기기 간 동기화\n- 자동 배경 동기화\n- 보안 암호화된 저장\n- 어디서나 설정 접근
-
프로덕션에서 서버 측 클라우드 변수를 선호하세요:
BASE_URL
(동기 스케줄러에 의해 사용되는 내부 호출 URL)
CLOUD_URL
(클라우드 동기 엔드포인트 기본)
NEXT_PUBLIC_BASE_URL
과NEXT_PUBLIC_CLOUD_URL
은 호환성/UI 를 위해 여전히 지원되지만, 서버 런타임은 이제BASE_URL을 우선시합니다
/CLOUD_URL
-
Cloud sync 요청은 클라우드 DNS/네트워크 가용성이 없을 때 UI가 멈추는 것을 방지하기 위해 타임아웃 + 빠른 실패 동작을 사용합니다.
-
제공자 및 모델별 토큰 사용량 추적
-
비용 추정 및 지출 추세
-
월간 보고서 및 인사이트
-
AI 지출 최적화
💡 중요 - 대시보드 비용 이해: Usage Analytics 에서 표시되는 "비용"은 추적 및 비교 목적으로만 사용됩니다. 9Router 는 절대 아무것도 청구하지 않습니다. 유료 서비스를 사용하는 경우에만 제공자를 직접 지불합니다.
예시: 대시보드가 "$290 총 비용"을 표시하고 iFlow 모델을 사용할 때, 이는 유료 API 를 직접 사용하여 지불해야 할 금액을 의미합니다. 실제 비용은 =$0 (iFlow 는 무료 무제한) 입니다. 이를 "절약 추적기"로 생각하면 됩니다. 무료 모델이나 9Router 를 통해 라우팅하여 얼마나 절약하는지 표시합니다.
- 💻
Localhost- 기본, 오프라인 작동 - ☁️
VPS/Cloud- 기기 간 공유 - 🐳
Docker- 한 명령어로 배포 - 🚀
Cloudflare Workers- 글로벌 엣지 네트워크
| 계급 | 제공자 | 비용 | 할당량 리셋 | 가장 좋은 용도 |
|---|---|---|---|---|
| 🚀 토큰 절약기 | ||||
| RTK (내장) | ||||
| 무료 | ||||
| 항상 켜짐 | 모든 요청에서 20-40% 토큰 절감 | |||
| 💳 구독 |
| Codex (Plus/Pro) | $20-200/월 | 5 시간 + 주 단위 | OpenAI 사용자 | |
| GitHub Copilot | $10-19/월 | 월 단위 | GitHub 사용자 | |
| Cursor IDE | $20/월 | 월 단위 | Cursor 사용자 | |
💰 저렴 |
GLM-5.1 / GLM-4.7 | $0.6/1M | 매일 오전 10 시 | 예산 백업 |
| MiniMax M2.7 | $0.2/1M | 5 시간 회전 | 가장 저렴한 옵션 |
| Kimi K2.5 | $9/월 고정 | 1,000 만 토큰/월 | 예측 가능한 비용 |
🆓 무료 |
Kiro AI | $0 | 무제한 | Claude 4.5 + GLM-5 + MiniMax 무료 |
| OpenCode Free | $0 | 무제한 | 인증 없음, 자동 모델 가져오기 |
| Vertex AI | $300 크레딧 | 새 GCP 계정 | Gemini 3 Pro + DeepSeek + GLM-5 |
💡 프로 팁: RTK + Kiro AI + OpenCode Free 조합 = $0 비용 + 20-40% 토큰 절감!
9Router 청구 현실:
✅ 9Router 소프트웨어 = 영원히 무료 (오픈 소스, 절대 청구 없음)
✅ 대시보드 "비용" = 표시/추적용만 (실제 청구서 아님)
✅ 제공자 직접 지불 (구독 또는 API 수수료)
✅ 무료 제공자는 계속 무료 (iFlow, Kiro, Qwen = $0 무제한)
❌ 9Router 는 절대로 영수증을 발송하거나 카드에 청구하지 않음
비용 표시 작동 방식:
대시보드는 유료 API 를 직접 사용하는 것처럼 추정 비용을 표시합니다. 이는 청구서가 아님 - 절약량을 보여주는 비교 도구입니다.
예시 시나리오:
대시보드 표시:
• 총 요청 수: 1,662
• 총 토큰: 47M
...
결제 규칙:
구독 제공자(Claude Code, Codex): 웹사이트를 통해 직접 결제
저렴한 제공자(GLM, MiniMax): 직접 결제하고, 9Router는 단순히 라우팅만 수행
무료 제공자(iFlow, Kiro, Qwen): 영원히 진정으로 무료이며, 숨겨진 비용 없음
9Router: 결코任何费用도 청구하지 않음, 절대
문제: 할당 기간이 사용되지 않은 경우 만료되고, 집중적인 코딩 중에는 속도 제한 적용
해결책:
Combo: "maximize-claude"
1. cc/claude-opus-4-7 (구독을 최대한 활용)
2. glm/glm-5.1 (할당 기간이 없을 때 저렴한 백업용)
...
문제: 구독 비용을 감당하지 못하며, 신뢰할 수 있는 AI 코딩이 필요함
해결책:
Combo: "free-forever"
1. kr/claude-sonnet-4.5 (Claude 4.5 무료 무제한 사용)
2. kr/glm-5 (Kiro 를 통해 GLM-5 무료 사용)
...
문제: 마감 기한이 있고, 다운타임을 감당할 수 없음
해결책:
Combo: "always-on"
1. cc/claude-opus-4-7 (최고 품질)
2. cx/gpt-5.5 (두 번째 구독)
...
문제: 메신저 앱 (WhatsApp, Telegram, Slack...) 에서 AI 어시스턴트를 필요로 하며, 완전히 무료
해결책:
Combo: "openclaw-free"
1. kr/claude-sonnet-4.5 (Claude 4.5 무료 사용)
2. kr/glm-5 (GLM-5 무료 사용)
...
📊 왜 내 대시보드에 높은 비용이 표시됩니까?
대시보드는 토큰 사용량을 추적하고, 유료 API 를 직접 사용하는 것처럼 예상 비용을 표시합니다. 이는 실제 청구가 아님 - 9Router 를 통해 무료 모델이나 기존 구독을 사용하여 얼마나 절약하는지 보여주는 참고 자료입니다.
예시:
대시보드 표시: "$290 총 비용"
현실: iFlow (무료 무제한 사용)
실제 비용: $0.00
$290 의 의미: 유료 API 대신 무료 모델을 사용하여 절약한 금액!
비용 표시는 사용 패턴과 최적화 기회를 이해하는 데 도움이 되는 "절약 추적기" 입니다.
💳 9Router 에서 청구될까요?
아니요. 9Router 는 무료이며 오픈소스 소프트웨어로, 자신의 컴퓨터에서 실행됩니다. 결코任何费用도 청구하지 않습니다.
다음만 결제:
- ✅
구독 제공자(Claude Code $20/월, Codex $20-$200/월) → 웹사이트에서 직접 결제 - ✅
저렴한 제공자(GLM, MiniMax) → 직접 결제하고, 9Router 는 단순히 요청을 라우팅만 수행 - ❌
9Router 자체→ 절대로任何费用도 청구하지 않음, 절대
9Router 는 로컬 프로кси/라우터입니다. 신용카드를 가지고 있지 않으며, 송금을 할 수 없고, 청구 시스템이 없습니다. 완전히 무료 소프트웨어입니다.
🆓 무료 제공자는 정말로 무제한입니까?
네! 현재 무료 제공자 (Kiro, OpenCode Free, Vertex) 는 숨겨진 비용 없이 진정으로 무료입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub Trending All (daily)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기