세션마다 토큰을 낭비하고 프로젝트를 다시 설명하는 일을 멈추세요
요약
Recall은 Claude Code 사용자를 위한 로컬 기반 세션 관리 도구입니다. 로컬 알고리즘을 통해 세션 로그를 요약하여 context.md로 저장함으로써, 매번 프로젝트를 다시 설명할 필요 없이 토큰 비용을 절감하고 연속적인 작업 환경을 제공합니다.
핵심 포인트
- 로컬 알고리즘 기반 요약으로 추가 API 비용 및 토큰 소모 방지
- 압축된 context.md를 통해 세션 간 빠른 컨텍스트 재개 가능
- 데이터가 외부로 전송되지 않는 강력한 개인정보 보호 및 보안 제공
- 설정이나 별도의 모델 설치가 필요 없는 Zero-friction 사용성
Claude Code는 모든 세션을 차갑게(cold) 시작합니다. Recall은 세션의 로컬 로그를 유지하고 이를 재개 가능한 요약본으로 압축합니다 — 이 모든 과정은 전적으로 사용자의 기기 내에서 이루어집니다. API 키도, 외부 모델도 필요 없으며, 그 어떤 것도 외부로 전송되지 않습니다. 이 도구는 구독 기반으로 Claude Code를 로컬에서 실행하는 사람들을 위해 구축되었습니다. 루프 내의 유일한 AI는 Claude Code 자체이며, 요약은 전통적인 Python 요약기(summarizer)에 의해 수행됩니다.
왜 Recall 인가요?
구독 서비스 내에서 무료로 사용할 수 있습니다. 이 도구는 비용을 발생시키는 유료 요약기를 사용하지 않고도, 매 세션마다 프로젝트를 다시 설명해야 하는 콜드 스타트(cold-start) 문제를 해결합니다. 요약은 LLM 호출이 아닌 로컬 알고리즘을 통해 이루어지므로, 지속적인 메모리 사용에 있어 이미 지불하고 있는 구독료 외에 추가 비용이 들지 않습니다.
사용 크레딧을 절약하는 두 가지 방법:
(1) 요약이 로컬에서 생성되므로, 메모리를 캡처하고 업데이트할 때 모델 토큰(model tokens)이 전혀 소모되지 않습니다.
(2) 매 세션마다 프로젝트를 처음부터 다시 설명하는 대신, 압축된 context.md (~1–2K 토큰)에서 재개함으로써 세션당 소모되는 토큰을 훨씬 줄일 수 있습니다. 이는 구독의 사용 한도를 늘려주거나(또는 API 사용 시 청구되는 크레딧을 낮춰줍니다).
그 어떤 것도 사용자의 기기를 떠나지 않습니다. 사용자의 트랜스크립트(코드, 경로, 때로는 비밀 정보)는 어떤 API로도 전송되지 않습니다.
대부분의 "메모리" 도구들은 컨텍스트를 모델 엔드포인트(model endpoint)로 전달하지만, Recall은 그들이 제공할 수 없는 개인정보 보호 보장을 제공합니다.
마찰 없는 사용(Zero-friction). pip install도 필요 없고, 실행할 로컬 모델도 없으며, 설정할 키도 없습니다. 오프라인에서도 작동합니다. 플러그인이 로드되는 즉시 작동을 시작합니다.
프로젝트 내 .recall/ 폴더 아래에 두 개의 파일이 작성됩니다:
history.md — 로그입니다. 추가 전용(Append-only) 방식입니다. 모든 세션이 발생하는 즉시 여기에 기록됩니다 (사용자의 프롬프트, Claude의 답변, 수정된 파일 및 실행된 명령).
context.md — 요약본입니다. 로컬 요약기에 의해 덮어쓰기 됩니다. 다음 세션에 로드할 압축된 "현재 상황" 정보입니다: 목표, 요약, 다음 단계 / 진행 중인 스레드, 수정된 파일, 그리고 마지막으로 작업했던 지점.
여기에서 읽고 설치하세요 https://github.com/raiyanyahya/recall
감사합니다
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기