Muxer: 서브태스크별 모델 라우팅을 통해 Claude Code 비용을 절감하는 오픈 소스 모델 멀티플렉서

Muxer는 에이전트 프론트매터(agent frontmatter)와 세션 훅(session hooks)을 통해 서브태스크(subtask)별로 모델을 멀티플렉싱(multiplexing)함으로써 Claude Code 비용을 절감합니다. 계획 수립에는 Fable/Opus를 유지하고, 상용구(boilerplate) 작업은 Haiku로 라우팅하세요.

핵심 요약 (Key Takeaways)

Muxer는 에이전트 프론트매터(agent frontmatter)와 세션 훅(session hooks)을 통해 서브태스크(subtask)별로 모델을 멀티플렉싱(multiplexing)함으로써 Claude Code 비용을 절감합니다.
계획 수립에는 Fable/Opus를 유지하고, 상용구(boilerplate) 작업은 Haiku로 라우팅하세요.

변경 사항 — 업데이트 내용

Muxer는 고가의 모델이 세션을 오케스트레이션(orchestrate)하는 동안 저렴한 모델이 실제 작업을 수행하도록 하는 오픈 소스 Claude Code 플러그인입니다. 최근 GitHub에 공개되었으며, Max 플랜을 사용하는 사람이라면 누구나 공감할 만한 문제점을 해결합니다. 즉, 오케스트레이터 모델(Fable, Opus)이 파일을 검색(grep)하거나 상용구(boilerplate)를 작성하는 것과 같은 사소한 작업이라도 생성되는 모든 서브태스크(subtask)에 대해 비용을 청구한다는 점입니다.

Muxer는 세 가지 메커니즘을 통해 작동합니다:

에이전트 프론트매터 (Agent frontmatter) — agents/*.md에 있는 각 에이전트에는 model: 라인이 있습니다. 스카우트(scout)는 항상 Haiku에서 실행되며, 빌더(builder)는 항상 Opus에서 실행됩니다. 이는 권장 사항이 아닌 엄격한 보장 사항입니다.
SessionStart 훅 (SessionStart hook) — scripts/session-policy.sh가 라우팅 정책을 주입합니다. Fable 세션에서는 "메인 루프를 가볍게 유지하라"고 지시하며, 더 저렴한 모델에서는 muxer:oracle을 통해 Fable까지 올라가는 에스컬레이션 경로(escalation path)를 추가합니다.
PreToolUse 가드 (PreToolUse guard) — scripts/guard-model.sh는 세션 모델을 상속받는 서브 에이전트(Explore, Plan)를 포착하여, 별도로 재정의되지 않는 한 Opus로 고정합니다. 이를 통해 파일 탐색 시 프리미엄 비용이 발생하는 것을 방지합니다.

사용자에게 미치는 영향 — 구체적인 효과

Max 플랜을 사용 중이라면, 가장 큰 비용 발생 원인은 프롬프트의 개수가 아니라 각 서브태스크(subtask)를 실행하는 모델입니다. Claude Code의 내장 서브 에이전트(subagents)는 기본적으로 세션 모델을 상속받습니다. Fable 세션에서는 모든 grep, find 및 상용구(boilerplate) 작성이 프리미엄 요율로 청구됩니다.

Muxer의 접근 방식은 "Claude Fable 5 in Claude Code: The Routing Strategy That Saves Your Weekly Limit" (2026-07-02)에서 다루었던 전략을 반영합니다. 차이점은 다음과 같습니다: Muxer는 프롬프트 엔지니어링 (Prompt Engineering)에 의존하는 대신, 에이전트 프론트매터 (Agent Frontmatter)를 통해 확실한 보장을 제공한다는 점입니다.

이 프로젝트에는 품질 관리를 위한 규칙도 포함되어 있습니다:

취향이 중요한 작업 (UI, CSS, 게임의 느낌 등)은 비용 힌트와 관계없이 절대 Opus 미만의 모델을 사용하지 않습니다.
검증자 (Verifier)는 자신이 심사하는 빌더 (Builder)보다 저렴한 모델을 사용하지 않습니다.
특정 티어에서 두 번의 리뷰에 실패한 작업은 새로운 브리프 (Brief)와 함께 한 단계 높은 티어에서 다시 수행됩니다.

지금 바로 시도해 보세요 — 명령어, 설정 및 프롬프트

1. 클론 및 설정

git clone https://github.com/DangerousYams/muxer.git
cd muxer
# 에이전트와 훅(hooks)을 귀하의 Claude Code 프로젝트로 복사합니다
...

2. 에이전트 프론트매터 (Agent Frontmatter) 설정

agents/scout.md 생성:

---
model: haiku
---
...

agents/builder.md 생성:

---
model: opus
---
...

3. 세션 훅 (Session Hook) 설치

~/.claude/hooks/session-start.sh 파일에:

#!/bin/bash
# 세션 모델이 Fable인 경우, 위임 정책을 주입합니다
if [ "$CLAUDE_SESSION_MODEL" = "fable" ]; then
...

4. 실행 및 절감액 확인

Fable에서 Claude Code 세션을 시작합니다. Muxer는 각 작업이 끝난 후 $ saved (절감된 금액)를 출력합니다. Scout는 Haiku에서, Builder는 Opus에서 실행되며, Fable는 오직 계획 및 리뷰를 위해서만 사용되는 것을 확인할 수 있습니다.

작동 원리

Monitoring Claude Code costs on AWS Bedrock | by hackthebox | Medium

Claude Code는 오케스트레이터 (Orchestrator)가 서브태스크를 생성하는 시점에 해당 작업을 위한 모델을 선택합니다. Muxer는 세 가지 방향에서 이 결정에 관여합니다: 에이전트 프론트매터가 모델을 보장하고, 세션 훅이 정책을 설정하며, 가드 (Guards)가 생성되지 않은 오버라이드 (Override)를 잡아냅니다. 이러한 3중 레이어 접근 방식은 프롬프트 엔지니어링을 신뢰할 필요 없이, 확실한 라우팅 (Routing) 보장을 제공함을 의미합니다.

사용 시점

Max plan 사용자 — 가장 큰 비용은 Fable/Opus 서브태스크입니다. Muxer가 이를 절감합니다.
다중 모델 워크플로우 — 특정 작업을 Gemini나 OpenAI Codex를 통해 라우팅하고 싶을 때 사용합니다.
품질 민감 프로젝트 — 검토 에스컬레이션 규칙이 저렴한 모델이 쓰레기를 만들지 않도록 보장합니다.

주의사항 (Caveats)

Muxer는 새로 나온 도구입니다 (작성 시점 기준 HN에서 2포인트, 0개 댓글). 가드 스크립트(guard script) 접근 방식은 실험적입니다. 프로덕션에 배포하기 전에 작은 프로젝트로 테스트해 보세요. 또한, "How Navan's MCP Server Cuts Travel Booking from 8 Steps to 1 Command" (2026-07-02)에서 언급했듯이, 세션 동작을 수정하는 모든 도구는 예상치 못한 상호작용을 유발할 수 있으므로 처음 몇 번의 세션을 면밀히 모니터링해야 합니다.

출처: github.com

[ ext{hn} ext{ extunderscore}claude ext{ extunderscore}code를 통해 04 Jul 업데이트]

새로운 경쟁자인 regolo-ai의 Brick-SR1이 유사한 모델 라우팅 접근 방식을 가진 모델에 대해 GitHub에 등장했습니다. 하지만 이 도구는 직접적인 비용 절감보다는 토큰 절감을 주장합니다. Muxer의 에이전트 프런매터(agent frontmatter) 시스템과 달리, Brick-SR1은 YAML 설정 파일을 사용하여 작업 유형별 라우팅 규칙을 정의하며, 저렴한 모델이 품질 검사를 통과하지 못할 경우 내장된 폴백 로직(fallback logic)을 포함합니다. 이 프로젝트는 Hacker News에서 9포인트를 받았으나 작성 시점 기준 댓글은 없으며, 초기 단계의 채택을 시사합니다. [regolo-ai/Brick-SR1에 따름]

원래 gentic.news에 게시됨

Insights

Muxer: 서브태스크별 모델 라우팅을 통해 Claude Code 비용을 절감하는 오픈 소스 모델 멀티플렉서

요약

핵심 포인트

핵심 요약 (Key Takeaways)

변경 사항 — 업데이트 내용

사용자에게 미치는 영향 — 구체적인 효과

지금 바로 시도해 보세요 — 명령어, 설정 및 프롬프트

1. 클론 및 설정

2. 에이전트 프론트매터 (Agent Frontmatter) 설정

3. 세션 훅 (Session Hook) 설치

4. 실행 및 절감액 확인

작동 원리

사용 시점

사용 시점

주의사항 (Caveats)

댓글

n8n AI Agent 노드: 도구, 메모리 및 다단계 추론을 활용한 자율 AI 워크플로우 구축 [무료 워크플로우 JSON]

토큰화된 자산의 실제 소유자는 누구인가? IMF가 답을 원하는 이유

Currys 이익 18% 증가, CEO 승계 확정

파일 업로드 없이 Mac에서 Claude Skills를 로컬로 실행하기

n8n AI Agent 노드: 도구, 메모리 및 다단계 추론을 활용한 자율 AI 워크플로우 구축 [무료 워크플로우 JSON]

토큰화된 자산의 실제 소유자는 누구인가? IMF가 답을 원하는 이유

Currys 이익 18% 증가, CEO 승계 확정

파일 업로드 없이 Mac에서 Claude Skills를 로컬로 실행하기