
Claude Code의 토큰을 「측정 후 절감하기」 — /usage로 무엇을 파악하고 어디를 줄일 것인가
요약
Claude Code의 `/usage` 명령어를 활용하여 세션 내 토큰 사용량을 측정하고 분석하는 방법을 설명합니다. 비용 추정치와 API 처리 시간 등 주요 지표의 의미를 파악하고, 스킬 및 MCP 서버별 사용량 내역을 통해 효율적인 토큰 절감 전략을 세우는 법을 다룹니다.
핵심 포인트
- `/usage` 명령어로 세션의 토큰 사용 통계 및 비용 추정치 확인 가능
- `Total cost`는 실제 청구 금액이 아닌 세션 무게 측정을 위한 로컬 추정치임
- 스킬, 서브 에이전트, MCP 서버별 사용량 비중(%) 확인 가능
- 측정 후 절감하는 최적화 프로세스의 중요성 강조
📦 이 기사에서 다루는 「컨텍스트를 가볍게 만드는」 기술 (CLAUDE.md 설계 등)은 무료 리포지토리 (GitHub · CC BY 4.0)를 통해 배포하고 있습니다. 바로 시도해보고 싶은 분은 기사 끝의 「지금 바로 시도하기」를 확인해 주세요.
Claude Code를 매일 사용하다 보면 다음과 같은 고민이 생깁니다.
- 같은 작업을 하고 있는 것 같은데, 세션에 따라 유독 컨텍스트가 불어나는 느낌이 든다
- MCP 서버나 스킬을 잔뜩 추가한 결과, 무엇이 가장 「무거운지」 모르겠다
- 막연하게
/clear나/compact를 입력하고 있지만, 효과가 있는지 확신이 서지 않는다
토큰 절감에 관한 기사는 세상에 많이 있지만, 그 대부분은 「우선 줄이기」부터 시작합니다. 순서가 반대입니다. 최적화는 「측정 → 절감」이 철칙이며, Claude Code에는 측정하기 위한 공식 명령어가 준비되어 있습니다. 그것이 바로 /usage입니다.
이 기사는 「무엇을 줄일 것인가」의 전 단계인, 「현재 얼마를 사용하고 있으며 어디가 무거운지 확인하는」 단계를 공식 문서에 기재된 사실만으로 해설합니다. 추측된 사양은 작성하지 않습니다. 출처는 기사 끝에 정리하겠습니다.
Claude Code 세션 중에 /usage를 입력하기만 하면 됩니다. 설정도 설치도 필요 없으며, 화면 상단의 Session 블록에 현재 세션의 토큰 사용 통계가 표시됩니다.
공식 문서에 나와 있는 표시 예시는 다음과 같습니다.
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
...
각각의 의미는 다음과 같습니다.
| 표시 | 내용 |
|---|---|
Total cost | 이 세션의 비용 추정치 (후술: 청구 금액과는 별개) |
Total duration (API) | API가 실제로 처리한 시간 |
Total duration (wall) | 세션을 열어두었던 실제 시간 (벽시계 시간) |
Total code changes | 추가·삭제한 행 수 |
이 부분은 오해하기 쉬우므로 공식 용어 그대로 작성합니다.
Total cost금액은 토큰 수로부터 로컬에서 계산된 추정치이며, 실제 청구 금액과 다를 수 있습니다 (공식 문서 원문: "The dollar figure is an estimate computed locally from token counts and may differ from your actual bill.").- 애초에 Session 블록은 API 사용자용 표시입니다. Claude Max / Pro 구독 이용자는 사용량이 구독에 포함되어 있기 때문에, 이 세션 비용 숫자는 청구 관점에서는 관계가 없습니다.
- 정식 청구 내역을 확인하고 싶다면, Claude Console의 Usage 페이지를 확인하는 것이 공식 안내입니다.
즉, 구독 사용자에게 Total cost는 「청구서」가 아니라, 세션의 무게를 측정하는 기준 메터로 사용하는 것이 올바른 해석입니다.
여기서부터가 토큰 다이어트의 핵심입니다.
Pro · Max · Team · Enterprise 플랜의 경우, /usage는 동일한 화면에 추가로 다음과 같은 항목을 표시합니다.
- Plan usage bars (플랜 한도 대비 사용량 바)
- Activity stats (활동 통계)
- 그리고 사용량 내역 (breakdown)
이 내역이 중요하며, 공식 문서에 따르면 최근 사용량을 「스킬 / 서브 에이전트 (subagent) / 플러그인 / 개별 MCP 서버」별로 할당하여, 각각을 전체에 대한 %로 표시합니다.
원문: "It attributes recent usage to skills, subagents, plugins, and individual MCP servers, with each shown as a percentage of the total."
즉 「무엇이 나의 토큰을 잡아먹고 있는지」를 감각이 아닌 %로 지목할 수 있다는 뜻입니다.
내역 표시 화면에서는,
d 키 → 최근 24시간
w 키 → 최근 7일간
을 전환할 수 있습니다 (원문: "Press d or w...")
를 전환할 수 있습니다 (원문: "Press d or w...").
「오늘의 작업」에서 무거운 것과 「이번 일주일 내내 무거운 것」은 별개의 문제입니다. 항상 무거운 MCP 서버는 7일 보기에서 명확히 드러납니다.
숫자를 무조건 믿지 않기 위해, 공식 제한 사항도 그대로 적어둡니다.
- 표시되는 숫자는 **대략적인 값 (approximate)**입니다.
- 이 머신의 로컬 세션 기록으로부터 계산됩니다.
- 따라서 다른 디바이스나 claude.ai 상에서의 사용량은 포함되지 않습니다.
여러 대의 머신에서 Claude Code를 사용하는 분들은, "한 대 분의 대략적인 수치를 보고 있다"는 점을 이해한 상태에서 읽는 것이 정답입니다.
/usage에는 공식 에일리어스 (Alias, 별칭)가 있습니다.
| 명령 | 공식 설명 |
|---|---|
/usage | 세션 비용, 플랜 사용 한도, 활동 통계를 표시. Pro/Max/Team/Enterprise에서는 스킬(Skill), 서브 에이전트(Sub-agent), 플러그인(Plugin), MCP 서버별 내역도 표시 |
/cost | /usage의 에일리어스 |
/stats | (Stats 탭에서 열기) /usage의 에일리어스 |
치기 편한 것을 사용하면 동일한 화면으로 이동할 수 있습니다.
그리고 자주 혼동되는 것이 /context입니다. 이것은 별개의 것이므로 역할을 나누어 기억해 두세요.
| 명령 | 무엇을 보는 것 |
|---|---|
/usage | 비용, 플랜 사용량, 이용 내역 (시간축: 최근 24h/7일) |
/context | 현재 이 세션의 컨텍스트 윈도우 (Context Window) 내부를 색상이 있는 그리드로 시각화. 최적화 제안도 제공함 (원문: "Visualize current context usage as a colored grid. Shows optimization suggestions...") |
거칠게 말하자면, /usage는 "기간별로 보는 돈/사용량 미터기"이고, /context는 "지금 이 순간의 컨텍스트 지도"입니다. **"무엇이 컨텍스트 (context)를 차지하고 있는가"를 직접 보고 싶을 때는 /context**가 정답이며, 여기서는 툴 (tool) 단위, 메모리 비대화, 용량 경고까지 알려줍니다.
/usage의 내역이나 /context를 통해 "무거운 범인"을 찾아냈다면, 공식 문서에서 제시하는 절감책으로 바로 연결됩니다. 여기에서도 공식적으로 명시된 수단만을 나열합니다.
-
MCP의 툴 정의는 기본적으로 지연 로드 (deferred) 방식이므로, Claude가 실제로 해당 툴을 사용하기 전까지는 툴 이름만 컨텍스트에 들어갑니다. 무엇이 컨텍스트를 소비하고 있는지는
/context로 확인할 수 있습니다. 그럼에도 항상 무거운 MCP가 있다면,/mcp로 설정된 서버를 확인하고 사용하지 않는 것을 비활성화합니다. 애초에 (툴별 리스트 분량이 올라가지 않도록) 공식에서는 CLI를 사용하는 것을 권장합니다.gh,/aws,/gcloud,/sentry-cli와 같은 CLI를 사용할 수 있다면 그쪽이 컨텍스트 효율이 더 좋습니다. -
CLAUDE.md는 세션 시작 시 컨텍스트로 읽혀집니다. PR 리뷰나 DB 마이그레이션과 같은 "특정 워크플로우 전용 상세 절차"가 적혀 있으면, 무관한 작업을 하는 중에도 해당 토큰이 자리를 차지합니다. 대책은 전용 절차를 스킬 (Skill)로 옮기는 것입니다. 스킬은 호출되었을 때만 온디맨드 (On-demand)로 읽히기 때문에 베이스 컨텍스트를 작게 유지할 수 있습니다. 공식적인 가이드는 **"CLAUDE.md는 200행 미만을 목표로 한다 (본질만 남긴다)"**입니다.
여기서 배포 중인 무료 리포지토리의 "CLAUDE.md 설계" 스킬은, 바로 이 "비대해진 CLAUDE.md를 어떻게 분할하고 정리할 것인가"에 대한 패턴을 정리한 것입니다 (기사 끝부분의 "지금 바로 시도하기" 참고).
-
로그 처리, 테스트 실행, 문서 가져오기(document retrieval)와 같은 冗長한 출력은 서브 에이전트(sub-agent)에게 위임하면, 그 방대한 출력은 서브 에이전트 측의 컨텍스트(context)에 머물고 메인 에이전트에는 요약본만 반환됩니다. 단, 에이전트 팀(agent team)은 토큰을 많이 소비한다는 점에 주의해야 합니다. 공식 문서에 따르면 "teammates가 plan mode로 동작하면 표준 세션보다 약 7배의 토큰을 사용한다(각 teammate가 자신만의 컨텍스트 윈도우(context window)를 갖기 때문)"라고 명시되어 있습니다. 팀의 태스크는 작고 자기 완결적으로 구성하는 것이 권장됩니다.
-
/clear: 무관한 작업으로 전환할 때 컨텍스트(context)를 리셋합니다. 오래된 컨텍스트는 이후의 모든 메시지에서 토큰을 낭비하게 됩니다. -
/compact [지시]: 대화가 길어지면 요약을 통해 컨텍스트(context)를 압축합니다./compact Focus on code samples and API usage와 같이 남기고 싶은 관점을 지정할 수 있습니다. -
/model: 많은 코딩 작업은 Sonnet으로도 충분하며 Opus보다 저렴하다고 공식적으로 안내하고 있습니다. 복잡한 설계나 다단계 추론(multi-step reasoning)이 필요할 때만 Opus를 사용하는 방식입니다. -
/effort: 확장 사고(extended thinking)의 effort level을 낮추면 비용을 줄일 수 있습니다(thinking 토큰은 출력 토큰으로 과금됩니다). 간단한 태스크에서는 level을 낮추세요.
"아무것도 하지 않는데 토큰이 움직이는 것 같다"는 현상에 대해서도 공식적인 설명이 있습니다.
Claude Code는 유휴(idle) 상태에서도 일부 백그라운드 기능을 통해 토큰을 사용합니다.
- 대화 요약 (
claude --resume을 위해 과거 대화를 요약하는 작업) - 명령어 처리 (
/usage와 같이 상태 확인을 위해 요청을 보내는 명령어)
단, 공식 기재에 따르면 이들은 통상 1 세션당 $0.04 미만의 소량입니다(유스케이스에 따라 다를 수 있음을 유의하세요).
- 먼저
/usage(또는/cost//stats)를 입력하여 세션의 무게와 (Pro/Max/Team/Enterprise 사용 시) 스킬(skill)·서브 에이전트(sub-agent)·플러그인(plugin)·MCP별 % 내역을 확인합니다.d/w로 24시간 ↔ 7일 단위를 전환할 수 있습니다. - "지금 이 컨텍스트(context)의 내용"을 직접 보고 싶을 때는
/context를 사용합니다. 무거운 도구(tool), 메모리 비대화, 용량 경고까지 표시됩니다. - 원인을 찾았다면, MCP 비활성화 / CLAUDE.md → 스킬(skill)로 이전 / 서브 에이전트(sub-agent) 위임 / 등의 공식 대책으로 연결합니다.
/clear·/compact·/model·/effort
"왠지 무겁다"를 "%로 지목할 수 있다"로 바꾸는 것만으로도, 절감을 위한 조치는 단번에 구체화됩니다.
/usage를 통해 "CLAUDE.md나 스킬(skill)이 무겁다"는 것을 알게 되었을 때, 다음에 해야 할 일은 **CLAUDE.md 정리(200행 미만 목표 · 전용 절차는 스킬(skill)로 이동)**입니다. 그 "패턴"을 그대로 복사해서 사용할 수 있는 형태(절차 및 안티 패턴 포함)로 무료 공개하고 있습니다 (일본어·영어·CC BY 4.0, 수정 및 상업적 이용 자유).
3단계로 시도할 수 있습니다:
① 리포지토리(repo) 열기
👉 https://github.com/noguso245-jpg/claude-code-skills-starter
② 컨텍스트(context) 정리에 효과적인 파일 2개 복사하기 (복사/붙여넣기 1회)
git clone https://github.com/noguso245-jpg/claude-code-skills-starter
cp claude-code-skills-starter/skills/ja/claude-md-architecture.md your-project/.claude/skills/
cp claude-code-skills-starter/skills/ja/agile-prompt-template.md your-project/.claude/skills/
③ 도움이 되었다면 ⭐ Star 누르기
⭐는 "마찬가지로 토큰 소비로 고민하는 사람들에게 이 리포지토리가 더 잘 발견되도록" 돕는 응원입니다.
새로운 무료 스킬(skill) 추가를 팔로우하고 싶다면 👁 Watch를 설정하여 업데이트 알림을 받으세요.
"다음에는 이 테마를 다뤄달라"는 요청도 댓글로 환영합니다.
X (최신 정보): @k___n___t_1125
새로운 무료 스킬을 추가하면 가장 먼저 X를 통해 공지하겠습니다. 토큰 절감 팁을 계속 확인하고 싶으시다면 팔로우하여 놓치지 마세요.
- 비용을 효과적으로 관리하기 (
/usage의 표시/내역,/d와/w전환, 로컬 추산치에 대한 주의사항, 절감 방안, 백그라운드 소비): https://code.claude.com/docs/en/costs - 명령어 (Commands) 레퍼런스 (/usage・/cost・/stats의 에일리어스(Alias) 관계,/context・/compact・/clear・/model・/effort・/mcp의 설명): https://code.claude.com/docs/en/commands
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기