패치 없이 AI 에이전트에 장기 기억 부여하기: Memory Sidecar v3.5.1 배포

Claude Code, Cursor, Hermes, Codex 등 제가 작업하는 모든 AI 에이전트는 매 세션마다 백지 상태에서 시작합니다. 컨텍스트 윈도우 (Context window)는 빠르게 채워지며, 한 번 가득 차고 나면 에이전트는 우리가 지난주, 지난 한 시간, 혹은 심지어 5분 전에 논의했던 내용을 전혀 기억하지 못합니다. 저는 아키텍처 결정 사항, 선호하는 라이브러리, 디버깅 컨텍스트 등을 계속해서 놓치고 있었습니다. 매우 답답한 상황이었습니다.

기존의 메모리 솔루션들을 살펴보았습니다. 일부 에이전트는 내장된 메모리를 가지고 있지만, 이는 대개 특정 모델이나 플랫폼에 종속되어 있습니다. 다른 솔루션들은 에이전트의 코드를 패치 (Patching)해야 하는데, 이는 업데이트가 있을 때마다 작동을 멈추게 만듭니다. 제가 매일 사용하는 다양한 에이전트들 사이에서 범용적으로 작동하는 것은 아무것도 없었습니다.

그래서 저는 사이드카 (Sidecar)를 만들었습니다. 어떤 에이전트 옆에서도 실행될 수 있는 외부 메모리 프로세스로, 에이전트의 데이터 디렉토리를 읽고, 세션을 아카이브하며, 장기 지식 그래프 (Long-term knowledge graph)를 구축하고, 관련 회상 (Recall) 정보를 미래의 작업에 다시 주입합니다. 패치는 필요 없습니다. 종속성도 없습니다. 그저 에이전트의 파일 시스템 (Filesystem)에 연결되어 메모리 관리를 수행하는 UNIX 스타일의 프로세스일 뿐입니다.

Memory Sidecar는 설계 단계부터 에이전트 불가지론적 (Agent-agnostic)입니다. 이 시스템은 에이전트의 AGENT_HOME 디렉토리를 모니터링하여 새로운 세션과 파일 쓰기를 감시함으로써 작동합니다. 그런 다음 해당 세션들을 다음과 같은 계층적 회상 시스템으로 처리합니다:

Hot memory (핫 메모리): 최근 세션 컨텍스트 (빠름, RAM에 유지)
Warm memory (웜 메모리): 최근 아카이브 (디스크에 인덱싱됨, 빠른 회상)
Cold memory (콜드 메모리): 오래된 통합 지식 (벡터 검색 (Vector search) 또는 키워드)
Curated notes (큐레이션된 노트): 항상 주입되어야 하는 사용자 정의 지식 (예: 프로젝트 컨벤션, 환경 문서)

새로운 세션이 시작되면, 사이드카는 현재 프로젝트를 확인하고 가장 관련성이 높은 메모리 청크 (Memory chunks)를 표면화합니다. 에이전트는 마치 팀원이 회의 전에 요약본을 전달해 주는 것처럼, 이를 주입된 컨텍스트 (Injected context)로 전달받습니다. 수동적인 --memory 플래그나 에이전트의 기존 워크플로우를 벗어난 API 호출도 필요하지 않습니다.

최신 릴리스인 v3.5.1은 현재의 공개 아키텍처(public architecture)를 위한 운영 안정화(operational hardening) 릴리스입니다. 설치 흐름을 정리하고, 서버 전용 경로(server-specific paths)나 자격 증명(credentials)을 제거했으며, 다양한 설정 환경에서 AGENT_HOME 감지가 안정적으로 작동하도록 개선했습니다. 이제 저장소(repository)는 완전히 공개되었으며, 실제 설치 피드백을 받을 준비가 되었습니다.

테스트 방법:

git clone https://github.com/mage0535/hermes-memory-installer
cd hermes-memory-installer
export AGENT_HOME=/path/to/your/agent/workspace
...

이것으로 끝입니다. 사이드카(sidecar)가 시작되어 모니터링을 수행하고 메모리 구축을 시작합니다. Claude Code나 Cursor와 같은 CLI 에이전트의 경우, 몇 번의 세션 내에 회상(recalls) 기능이 나타나는 것을 확인할 수 있습니다. 이는 지난번에 사용했던 접근 방식을 제안하거나, 어떤 라이브러리를 선택했는지 기억하며, 심지어 3주 전에 작성한 메모를 불러오기도 합니다.

저는 한 달 동안 네 개의 에이전트에 걸쳐 이를 실행해 왔습니다. 가장 큰 성과는 선호하는 라이브러리를 다시 설명할 필요가 없어졌고, 디버깅 히스토리(debugging history)를 잃어버리지 않게 되었으며, 에이전트가 모든 것을 하나의 프롬프트(prompt)에 유지할 필요가 없기 때문에 컨텍스트 윈도우(context window) 초과 현상이 눈에 띄게 감소했다는 점입니다.

완벽하냐고요? 아닙니다. 콜드 인덱스(cold index)가 성장함에 따라 메모리 품질은 시간이 지나면서 점진적으로 향상됩니다. 매우 큰 저장소(repository)의 경우, 주입 임계값(injection threshold)을 조정해야 할 수도 있습니다. 또한 지속적인 세션 로그(persistent session logs)를 작성하거나 워크스페이스 디렉토리(workspace directory)를 유지하는 에이전트와 함께 사용할 때 가장 잘 작동합니다. 하지만 패치 수정이 필요 없는(zero-patch), 에이전트 불가지론적(agent-agnostic) 메모리 레이어로서, 이는 제 일상적인 워크플로우에 게임 체인저(game-changer)가 되었습니다.

AI가 세션 사이의 모든 것을 잊어버리는 것에 지쳤다면, Memory Sidecar를 살펴보세요. 이 프로젝트는 오픈 소스(MIT)이며, Python 3.9+로 작성되었습니다. README를 통해 아키텍처와 커스터마이징(customization) 옵션을 확인할 수 있습니다.

GitHub: https://github.com/mage0535/hermes-memory-installer

Insights

패치 없이 AI 에이전트에 장기 기억 부여하기: Memory Sidecar v3.5.1 배포

요약

핵심 포인트

댓글

잘못된 AI 도구 선택의 실제 비용: 내가 저지를 뻔한 5만 달러의 실수

Intel 주가, 상반기 약 270% 급등 후 하루 만에 9% 하락. 7월 23일 전 저점 매수 기회인가?

Google AI Studio에서 Cloud SQL을 사용한 Web 애플리케이션 개발하기

AI 붐으로 인한 극적인 반등 속에 Kioxia, 차세대 메모리 샘플 출하 시작

Intel 주가, 상반기 약 270% 급등 후 하루 만에 9% 하락. 7월 23일 전 저점 매수 기회인가?

Google AI Studio에서 Cloud SQL을 사용한 Web 애플리케이션 개발하기

AI 붐으로 인한 극적인 반등 속에 Kioxia, 차세대 메모리 샘플 출하 시작