
Muxer: 서브태스크별 모델 라우팅을 통해 Claude Code 비용을 절감하는 오픈 소스 모델 멀티플렉서
요약
Muxer는 Claude Code 사용 시 서브태스크별로 모델을 다르게 할당하여 비용을 절감하는 오픈 소스 플러그인입니다. 에이전트 프론트매터와 세션 훅을 통해 계획 수립에는 고성능 모델을, 단순 작업에는 저렴한 모델을 라우팅합니다.
핵심 포인트
- 서브태스크별 모델 멀티플렉싱으로 Claude Code 비용 최적화
- 에이전트 프론트매터를 통한 모델 사용의 엄격한 보장
- 세션 훅과 가드 메커니즘을 활용한 지능적 라우팅 정책 적용
- 고성능 모델(Opus)과 저가형 모델(Haiku)의 효율적 역할 분담
Muxer는 에이전트 프론트매터(agent frontmatter)와 세션 훅(session hooks)을 통해 서브태스크(subtask)별로 모델을 멀티플렉싱(multiplexing)함으로써 Claude Code 비용을 절감합니다. 계획 수립에는 Fable/Opus를 유지하고, 상용구(boilerplate) 작업은 Haiku로 라우팅하세요.
핵심 요약 (Key Takeaways)
- Muxer는 에이전트 프론트매터(agent frontmatter)와 세션 훅(session hooks)을 통해 서브태스크(subtask)별로 모델을 멀티플렉싱(multiplexing)함으로써 Claude Code 비용을 절감합니다.
- 계획 수립에는 Fable/Opus를 유지하고, 상용구(boilerplate) 작업은 Haiku로 라우팅하세요.
변경 사항 — 업데이트 내용
Muxer는 고가의 모델이 세션을 오케스트레이션(orchestrate)하는 동안 저렴한 모델이 실제 작업을 수행하도록 하는 오픈 소스 Claude Code 플러그인입니다. 최근 GitHub에 공개되었으며, Max 플랜을 사용하는 사람이라면 누구나 공감할 만한 문제점을 해결합니다. 즉, 오케스트레이터 모델(Fable, Opus)이 파일을 검색(grep)하거나 상용구(boilerplate)를 작성하는 것과 같은 사소한 작업이라도 생성되는 모든 서브태스크(subtask)에 대해 비용을 청구한다는 점입니다.
Muxer는 세 가지 메커니즘을 통해 작동합니다:
-
에이전트 프론트매터 (Agent frontmatter) —
agents/*.md에 있는 각 에이전트에는model:라인이 있습니다. 스카우트(scout)는 항상 Haiku에서 실행되며, 빌더(builder)는 항상 Opus에서 실행됩니다. 이는 권장 사항이 아닌 엄격한 보장 사항입니다. -
SessionStart 훅 (SessionStart hook) —
scripts/session-policy.sh가 라우팅 정책을 주입합니다. Fable 세션에서는 "메인 루프를 가볍게 유지하라"고 지시하며, 더 저렴한 모델에서는muxer:oracle을 통해 Fable까지 올라가는 에스컬레이션 경로(escalation path)를 추가합니다. -
PreToolUse 가드 (PreToolUse guard) —
scripts/guard-model.sh는 세션 모델을 상속받는 서브 에이전트(Explore, Plan)를 포착하여, 별도로 재정의되지 않는 한 Opus로 고정합니다. 이를 통해 파일 탐색 시 프리미엄 비용이 발생하는 것을 방지합니다.
사용자에게 미치는 영향 — 구체적인 효과
Max 플랜을 사용 중이라면, 가장 큰 비용 발생 원인은 프롬프트의 개수가 아니라 각 서브태스크(subtask)를 실행하는 모델입니다. Claude Code의 내장 서브 에이전트(subagents)는 기본적으로 세션 모델을 상속받습니다. Fable 세션에서는 모든 grep, find 및 상용구(boilerplate) 작성이 프리미엄 요율로 청구됩니다.
Muxer의 접근 방식은 "Claude Fable 5 in Claude Code: The Routing Strategy That Saves Your Weekly Limit" (2026-07-02)에서 다루었던 전략을 반영합니다. 차이점은 다음과 같습니다: Muxer는 프롬프트 엔지니어링 (Prompt Engineering)에 의존하는 대신, 에이전트 프론트매터 (Agent Frontmatter)를 통해 확실한 보장을 제공한다는 점입니다.
이 프로젝트에는 품질 관리를 위한 규칙도 포함되어 있습니다:
- 취향이 중요한 작업 (UI, CSS, 게임의 느낌 등)은 비용 힌트와 관계없이 절대 Opus 미만의 모델을 사용하지 않습니다.
- 검증자 (Verifier)는 자신이 심사하는 빌더 (Builder)보다 저렴한 모델을 사용하지 않습니다.
- 특정 티어에서 두 번의 리뷰에 실패한 작업은 새로운 브리프 (Brief)와 함께 한 단계 높은 티어에서 다시 수행됩니다.
지금 바로 시도해 보세요 — 명령어, 설정 및 프롬프트
1. 클론 및 설정
git clone https://github.com/DangerousYams/muxer.git
cd muxer
# 에이전트와 훅(hooks)을 귀하의 Claude Code 프로젝트로 복사합니다
...
2. 에이전트 프론트매터 (Agent Frontmatter) 설정
agents/scout.md 생성:
---
model: haiku
---
...
agents/builder.md 생성:
---
model: opus
---
...
3. 세션 훅 (Session Hook) 설치
~/.claude/hooks/session-start.sh 파일에:
#!/bin/bash
# 세션 모델이 Fable인 경우, 위임 정책을 주입합니다
if [ "$CLAUDE_SESSION_MODEL" = "fable" ]; then
...
4. 실행 및 절감액 확인
Fable에서 Claude Code 세션을 시작합니다. Muxer는 각 작업이 끝난 후 $ saved (절감된 금액)를 출력합니다. Scout는 Haiku에서, Builder는 Opus에서 실행되며, Fable는 오직 계획 및 리뷰를 위해서만 사용되는 것을 확인할 수 있습니다.
작동 원리
Claude Code는 오케스트레이터 (Orchestrator)가 서브태스크를 생성하는 시점에 해당 작업을 위한 모델을 선택합니다. Muxer는 세 가지 방향에서 이 결정에 관여합니다: 에이전트 프론트매터가 모델을 보장하고, 세션 훅이 정책을 설정하며, 가드 (Guards)가 생성되지 않은 오버라이드 (Override)를 잡아냅니다. 이러한 3중 레이어 접근 방식은 프롬프트 엔지니어링을 신뢰할 필요 없이, 확실한 라우팅 (Routing) 보장을 제공함을 의미합니다.
사용 시점
사용 시점
- Max plan 사용자 — 가장 큰 비용은 Fable/Opus 서브태스크입니다. Muxer가 이를 절감합니다.
- 다중 모델 워크플로우 — 특정 작업을 Gemini나 OpenAI Codex를 통해 라우팅하고 싶을 때 사용합니다.
- 품질 민감 프로젝트 — 검토 에스컬레이션 규칙이 저렴한 모델이 쓰레기를 만들지 않도록 보장합니다.
주의사항 (Caveats)
Muxer는 새로 나온 도구입니다 (작성 시점 기준 HN에서 2포인트, 0개 댓글). 가드 스크립트(guard script) 접근 방식은 실험적입니다. 프로덕션에 배포하기 전에 작은 프로젝트로 테스트해 보세요. 또한, "How Navan's MCP Server Cuts Travel Booking from 8 Steps to 1 Command" (2026-07-02)에서 언급했듯이, 세션 동작을 수정하는 모든 도구는 예상치 못한 상호작용을 유발할 수 있으므로 처음 몇 번의 세션을 면밀히 모니터링해야 합니다.
출처: github.com
[ ext{hn} ext{ extunderscore}claude ext{ extunderscore}code를 통해 04 Jul 업데이트]
새로운 경쟁자인 regolo-ai의 Brick-SR1이 유사한 모델 라우팅 접근 방식을 가진 모델에 대해 GitHub에 등장했습니다. 하지만 이 도구는 직접적인 비용 절감보다는 토큰 절감을 주장합니다. Muxer의 에이전트 프런매터(agent frontmatter) 시스템과 달리, Brick-SR1은 YAML 설정 파일을 사용하여 작업 유형별 라우팅 규칙을 정의하며, 저렴한 모델이 품질 검사를 통과하지 못할 경우 내장된 폴백 로직(fallback logic)을 포함합니다. 이 프로젝트는 Hacker News에서 9포인트를 받았으나 작성 시점 기준 댓글은 없으며, 초기 단계의 채택을 시사합니다. [regolo-ai/Brick-SR1에 따름]
원래 gentic.news에 게시됨
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기