본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 05. 28. 22:07

AI 컨텍스트 소비로 고민하는 사람들을 위한 『context-mode』

요약

Claude Code 사용 시 발생하는 컨텍스트 과부하와 토큰 비용 문제를 해결하기 위한 'context-mode' 도구를 소개합니다. 도구의 출력을 샌드박스에 인덱싱하여 필요한 정보만 검색해 가져오는 방식으로 컨텍스트 소비를 획기적으로 줄여줍니다.

핵심 포인트

  • 도구 출력을 직접 대화에 쌓지 않고 샌드박스에 인덱싱하여 컨텍스트 절감
  • 웹사이트 개발 시 약 40~50%의 컨텍스트 절감 효과 관측
  • 세션 간 검색을 통해 이전의 결정과 에러를 지속적으로 유지 가능
  • 불필요한 토큰 소비를 줄여 팀 단위 운영 시 상당한 비용 절감 가능

・Claude Code를 사용 중이라면, mksglu 씨의 context-mode를 지금 바로 설치하세요.

/ctx-stats로 세션 종료 시 얼마나 절약되었는지 확인하며 흐뭇해해 보세요.

・웹사이트 개발 시에는 약 40~50% 정도의 컨텍스트 (Context) 절감이 관측되었습니다.

이하는 Claude가 작성했으므로 가볍게 읽으셔도 좋습니다.

Claude Code(뿐만 아니라 AI 코딩 에이전트 전반)를 오래 사용하다 보면 반드시 이 문제에 부딪힙니다.

Context low · /compact will run soon...

로그를 cat 하거나, git log를 흘려보내거나, JSON을 읽거나, 테스트를 실행하거나——

도구의 출력이 단 1바이트도 남김없이 대화 메모리에 쌓이게 됩니다.

그리고 일정량을 초과하면 /compact (자동 요약·압축)가 실행됩니다.

요약되는 것 자체는 나쁘지 않지만,

  • 요약될 때마다 세세한 뉘앙스가 누락됨
  • 압축 처리 시간만큼 기다려야 함
  • 무엇보다 "아까 조사했던 그거, 다시 조사해야 하나..."라는 상황이 발생함

이것은 은근히 스트레스이며, 은근히 토큰 (Token) 비용이 늘어납니다.

대략적으로 말하자면,

도구의 생출력을 대화에 직접 흘려보내지 않고, 일단 샌드박스 (Sandbox)에 모아서 전체 인덱스화 (Indexing).

필요한 부분만을 검색으로 가져오는 방식입니다.

예를 들어 1000행의 로그가 있어도, 대화에 쌓이는 것은 "에러 행만", "집계된 결과만".

생(Raw) 1000행은 대화 외부(인덱스)에 놓이므로 컨텍스트를 소비하지 않습니다.

게다가 모아둔 것은 세션을 넘나들며 검색할 수 있으므로,

--continue/resume으로 돌아왔을 때 "이전의 결정", "이전의 에러"를 그대로 불러올 수 있습니다.

여기서부터가 본론입니다. 요전 날, 제 프로젝트에서 이런 대시보드가 나왔습니다.

(프로젝트 이름·실제 정보 등은 숨겼습니다)

Without context-mode 214 KB ████████████████████████████████ 54.9K tokens
With context-mode 122 KB ████████████████░░░░░░░░░░░░░░ 31.3K tokens
→ 43%를 컨텍스트 외부로 밀어냈습니다
...

214 KB → 122 KB. 아무것도 의식하지 않았는데 자동으로 이렇게 되었습니다.

지표수치
컨텍스트 외부로 보낸 양 (이 채팅)210 KB
...
※ 달러 표기는 Opus 요율 기준의 "이해를 돕기 위한 용도"입니다.

저렴한 모델이라면 금액은 내려가겠지만, 절감 "율"은 변하지 않습니다.

"혼자서 $3.22? 별로 안 큰데?"라고 생각하실 수도 있지만,

이를 10인 팀에서 1년 동안 운영하면 ~$5,873/year라는 추산이 나옵니다. 티끌 모아 태산입니다.

이 세션에서 쌓였던 301건의 내역은 다음과 같습니다.

단순한 로그뿐만 아니라, 작업의 문맥(Context) 그 자체를 포착하고 있다는 것을 알 수 있습니다.

Files tracked 99 ████████████████████████████
Working directory 33 ███████░░░░░░░░░░░░░░░░░░░
sandbox 29 ████████░░░░░░░░░░░░░░░░░░░░
...

파일·작업 디렉토리·태스크·과거의 결정·포착한 에러까지.

그래서 "어라, 저번에 어떻게 결정했더라?"를 AI 측이 제대로 기억하고 있습니다.

덤으로 "자신의 작업 취향"까지 학습해 주었습니다.

11 preferences picked up:
무엇을 만들고 있는가 7
어떻게 일하는가 2
...

⚠️ 환경에 따라서는

/plugin을 통해 일반적인 방법으로 설치할 수 있습니다.

저는 /plugin을 사용할 수 없는 환경이었기에, 설정 JSON에 직접 작성하여 도입했습니다.

일반적으로 사용할 수 있는 분들은 플러그인 마켓플레이스에서 context-mode를 추가하기만 하면 됩니다.

도입 후에는 특별한 조작이 필요 없으며, 도구를 사용할 때마다 백그라운드에서 자동으로 인덱스화됩니다.

절약량을 확인하고 싶을 때는 이것을 사용하세요.

/ctx-stats

서두에 붙여넣었던 그 대시보드가 나타납니다.

(/ctx-doctor로 진단, /ctx-purge)

로 인덱스를 전부 삭제할 수도 있습니다.)


  • 긴 조사 세션이 끊기기 어려운 /compact 실행 횟수가 명확하게 감소
  • 세션 재개 능력이 강력함--continue로 돌아오면 이전 문맥이 제대로 남아 있음
  • 인지 비용(Cognitive Cost) 제로 → "절약해야지"라고 애써 노력할 필요가 없음. 넣기만 하면 알아서 작동함

반대로 주의할 점은 다음과 같습니다.

  • 파일 쓰기는 평소와 같이 에디터 측에서 수행합니다 (샌드박스(Sandbox) 실행은 분석 및 집계용임)
  • /clear/compact를 수행해도 인덱스 자체는 남습니다 (삭제하고 싶다면 ctx purge 사용)

Claude Code를 사용하고 있다면, 지금 바로 context-mode를 설치하세요.

  • 컨텍스트가 실측 43% 절감됨
  • AI가 /compact를 실행하기 전보다 2배 더 길게 작동할 수 있음
  • 토큰 비용까지 절약됨

게다가 도입 후의 번거로움은 거의 제로에 가깝습니다.

"컨텍스트가 넘쳐나기 시작했네..."라는 스트레스에서 해방되고 싶은 분들은 꼭 설치해 보세요.

설치했다면 /ctx-stats를 입력하여 자신이 얼마나 절감했는지 꼭 공유해 주셨으면 합니다. 아마 생각보다 훨씬 많이 줄어들어 있을 것입니다.

수치는 모두 본인의 실제 환경에서 출력된 /ctx-stats를 기반으로 합니다 (프로젝트명 및 운영 정보는 숨겼습니다).

달러(USD) 계산은 Opus 요율을 기준으로 한 참고치입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0