두 가지 도구로 Claude Code 토큰 사용량 60-90% 절약하기

요약 (TL;DR): 두 가지 도구가 서로 다른 두 계층에서 Claude Code의 토큰 사용량을 절감합니다. RTK는 명령 출력(command output)이 컨텍스트 창(context window)에 도달하기 전에 압축하는 셸 프록시(shell proxy)입니다. context-mode는 샌드박스(sandbox)에서 무거운 도구 작업(tool work)을 수행하고 결과값만 전달하는 Claude Code 플러그인입니다. 이들은 서로 깔끔하게 중첩되어 작동하며, 단 하나의 스킬(skill) 설치로 둘 다 설치할 수 있습니다. 이 글에서는 각 도구가 어떻게 작동하는지, 그리고 어떻게 연결하는지 설명합니다.

세션에 두 개의 명령어를 입력했을 뿐인데, 아직 코드 한 줄도 쓰지 않았음에도 컨텍스트 창(context window)의 3분의 1이 이미 차버렸습니다. pnpm install이 전체 의존성 트리(dependency tree)를 쏟아냈고, git log는 200개의 커밋 내역을 출력했으며, 이어서 스택 트레이스(stack trace)가 통째로 들어왔습니다. 이 중 어느 것도 제가 요청한 작업이 아니었습니다. 그저 컨텍스트 창에 자리 잡고 앉아 매 턴마다 토큰을 잡아먹고 있을 뿐이었습니다.

토큰 예산의 대부분은 설치 내역, 로그, 트레이스 같은 지루한 출력물에 소비됩니다. 이러한 정보들은 계속 쌓여서 매 턴마다 다시 읽히게 되며, 정작 당신이 원했던 영리한 추론(reasoning)에는 사용되지 않습니다. 두 가지 도구가 두 가지 방향에서 이 쌓여가는 정보 더미를 공략합니다. 어떻게 작동하는지, 그리고 어떻게 한 번의 명령으로 둘 다 설치하는지 소개합니다.

이 글은 시리즈의 마지막 글이며, 세 번째 글에서 다룬 스킬(skill) 패턴을 기반으로 합니다. 이 글의 URL을 Claude Code에 직접 전달하여 따라 할 수 있습니다.

토큰이 실제로 소비되는 곳

컨텍스트 창(context window)을 책상이라고 상상해 보세요. Claude가 필요로 하는 모든 것—당신의 프롬프트(prompts), Claude의 답변, 그리고 실행한 모든 명령어의 출력값—은 언제든 훑어볼 수 있도록 책상 위에 놓여 있습니다. 책상에는 크기 제한이 있으며, 일단 무언가가 놓이면 가장자리에 밀려나기 전까지 매 턴마다 다시 읽힙니다.

두 종류의 잡동사니가 그곳에 쌓입니다:

비대하게 들어오는 명령어 출력 (Command output): 의존성 설치, 긴 로그, 상세한 테스트 실행 결과 등입니다. 한 번 들어오면 그 이후의 모든 턴에서 토큰 비용을 발생시킵니다.
축적된 더미 (The accumulated pile) 그 자체: 적당한 크기의 출력물이라 할지라도 긴 세션 동안 계속 쌓이다 보면 결국 책상이 완전히 뒤덮이게 됩니다.

이 두 가지 도구는 앞서 언급한 두 가지 문제에 각각 대응합니다. RTK는 출력물이 책상에 닿기 전에 다듬어 버립니다. context-mode는 가장 무거운 작업이 아예 책상 위에 올라오지 않도록 합니다.

Layer 1: RTK, 도착하기 전에 다듬기

RTK는 셸 레벨 프록시 (shell-level proxy)입니다. Claude와 실행되는 명령 사이에서 동작하며, 출력을 가로채 컨텍스트 윈도우 (context window)에 도달하기 전에 압축합니다. 일반적인 개발 작업에서 60~90%의 비용 절감을 주장하며, 사용자가 단순히 주장을 믿는 대신 실제 수치를 확인할 수 있도록 rtk gain 명령어를 제공합니다.

작동 메커니즘은 훅 (hook) 방식입니다. Claude Code 통합 설정을 완료하면, Claude가 실행하는 모든 Bash 명령은 RTK를 거치도록 투명하게 재작성됩니다. 내부적으로 git status는 rtk git status로 바뀌지만, 사용자가 명령을 작성하거나 Claude가 명령을 작성하는 방식에는 변화가 없으며 재작성 자체에 따른 토큰 오버헤드도 발생하지 않습니다.

설치는 두 단계로 이루어집니다: 바이너리 (binary)를 넣고, 통합 설정을 연결하면 됩니다.

# 바이너리 설치 후 (해당 플랫폼의 README를 따르세요)
rtk init -g

그 다음, 올바른 도구인지 그리고 제대로 작동하는지 확인합니다:

rtk --version
rtk gain

주의해야 할 함정이 하나 있습니다: rtk라는 이름의 바이너리를 제공하는, 서로 관련 없는 두 번째 프로젝트(Rust 타입 툴킷)가 존재합니다. 깨끗하게 설치한 후에도 rtk gain 실행 시

이 도구는 MCP (Model Context Protocol) 서버와 훅(hooks)을 등록하기 때문에, context-mode는 Claude Code를 완전히 재시작한 후에야 활성화됩니다. 설치 방법은 일반적인 두 가지 플러그인 명령어를 사용합니다:

/plugin marketplace add mksglu/context-mode
/plugin install context-mode@context-mode

재시작한 후, 정상적으로 실행되었는지 확인합니다:

/context-mode:ctx-doctor

지름길: 두 가지를 위한 하나의 명령어

플랫폼마다 다른 두 가지 도구를 프로젝트가 진화함에 따라 변하는 단계들을 거치며 수동으로 설치하는 것은, 바로 Article 3에서 자동화해야 한다고 주장했던 종류의 번거로운 작업입니다. 따라서 이것 또한 하나의 기술(skill)입니다.

문제는 설치 단계가 시간이 지나면 낡게 된다는 점입니다. 오늘 명령어를 하드코딩해 두면, 두 프로젝트 중 어느 하나라도 플래그(flag)를 변경하는 순간 이 글은 쓸모없게 됩니다. 그래서 이 기술은 아무것도 하드코딩하지 않습니다. 대신 실행 시점에 각 도구의 최신 README를 가져와서, 현재 설치 섹션에 명시된 내용을 그대로 따릅니다.

---
name: setup-token-savings
description: Install RTK and context-mode to cut token usage
...

이 내용을 skills/setup-token-savings/SKILL.md에 넣으면, 새로운 환경에서도 명령어 하나로 두 도구를 모두 설치할 수 있습니다:

/your-plugin:setup-token-savings

조금 더 상세한 버전은 레퍼런스 리포지토리의 베이스 플러그인 기술(skills)에 있습니다: github.com/Nagell/claude-marketplace.

절약된 양 확인하기

rtk gain의 핵심은 헤드라인에 적힌 숫자를 맹목적으로 믿을 필요가 없다는 것입니다. 실제 사용을 통해 얻은 실제 절약량을 보고합니다:

rtk gain            # 현재까지의 총 절약량
rtk gain --history  # 명령어별 상세 내역

일정 시간이 지난 후의 결과

RTK Token Savings (Global Scope)
════════════════════════════════════════════════════════════
Total commands:    1539
...

rtk discover는 한 단계 더 나아가 Claude Code 히스토리를 스캔하여, RTK를 통해 라우팅하면 이득을 볼 수 있지만 아직 적용되지 않은 명령어들을 찾아냅니다. 이를 통해 시간이 흐를수록 적용 범위를 넓혀갈 수 있습니다.

마치며

이것이 전체 설정입니다. 여러분의 마켓플레이스(marketplace)는 플러그인(plugins)을 보유하고, 안전 장치(safety hooks)는 위험한 명령어를 포착하며, 단 하나의 명령어로 새로운 기기에 모든 것을 설치하고, 두 개의 명령어로 토큰 비용을 낮게 유지합니다. 이 구성 요소들 중 어느 하나도 그 자체로 거대하지는 않습니다. 하지만 여러분이 소유한 마켓플레이스 안에서 서로 연결되면, 다음 새 노트북을 세팅할 때 오후 시간을 통째로 날리는 대신 단 몇 번의 명령어만으로 끝낼 수 있습니다. 지금까지 내용을 따라오셨다면, 이 모든 것을 구현할 수 있는 스타터 템플릿(starter template)은 바로 이곳입니다: github.com/Nagell/claude-marketplace-template. 만약 단계를 놓치셨다면, 이 시리즈의 다른 기사들을 확인해 보세요.