Memory Sidecar v3.5: AI 에이전트를 위한 외장 메모리, 정식 공개

요약

AI 에이전트의 세션 간 기억 단절 문제를 해결하기 위해 개발된 외장 메모리 관리 도구 Memory Sidecar v3.5가 정식 공개되었습니다. 기존 에이전트 코드를 수정하지 않고도 4계층 검색 구조를 통해 지속적인 컨텍스트 유지를 지원합니다.

핵심 포인트

에이전트 코드를 수정하지 않는 외장 프로세스(Sidecar) 방식 채택
Hot, Warm, Cold, Knowledge의 4계층 계층적 검색 구조 제공
의도 라우팅을 통한 효율적인 컨텍스트 주입 및 관리
Markdown 노트를 활용한 지식 레이어 기능 추가

몇 달 동안 AI 에이전트 헤비 유저로 활동하며 느낀 가장 큰 단점은 모델의 능력이 아니라 **기억의 단절 (Memory Discontinuity)**이었습니다. 새로운 세션은 이전 기록을 인식하지 못하며, 방금 논의한 아키텍처 결정, API 주소, 배포 시의 문제점들은 터미널을 닫는 순간 모두 사라집니다. 대화를 이어갈 때마다 매번 다시 설명해야 하는데, 이는 직접 코드를 짜는 것보다 더 피곤한 일입니다.

저희가 개발한 Memory Sidecar v3.5가 방금 정식 공개되었습니다. 핵심 아이디어는 한 문장으로 요약됩니다: 에이전트 코드를 침해하지 않고, 외장 프로세스 (Sidecar Process)를 사용하여 기억을 관리한다. 이 도구는 여러분이 기존에 사용 중인 AI 에이전트 (Hermes, Claude Code, Codex, Cursor) 옆에서 실행되며, 세션 파일을 읽고, 지속적인 인덱스 (Persistent Index)를 구축하며, 다음 대화 시 관련 기억을 컨텍스트 (Context)에 다시 주입합니다.

4계층 검색 (Retrieval) + 의도 라우팅 (Intent Routing)

v3.5는 Docker에 의존하지 않고 핵심 코드 수정 없이 기억을 네 가지 계층으로 나눕니다:

핫 레이어 (Hot Layer) — 에이전트 로컬 메모리 도구로, 현재의 선호도와 활발한 수정 사항을 저장합니다. 5KB의 하드 제한이 있으며, 지연 시간(Latency)은 0ms입니다.
웜 레이어 (Warm Layer) — Hindsight PostgreSQL 사실 그래프 (Fact Graph)로, 세션에서 핵심 엔티티 (Entity)를 자동으로 추출하여 지속적으로 저장합니다.
콜드 레이어 (Cold Layer) — gbrain 구조화된 지식 그래프 (Knowledge Graph) + FTS5 전체 텍스트 검색 (Full-Text Search)으로, 주제 허브와 세션 아카이브를 저장합니다.
지식 레이어 (Knowledge Layer, v3.5 신규) — $AGENT_HOME/knowledge/notes/ 아래의 Markdown 노트를 스캔하여, 정리된 지식이 직접 검색에 참여할 수 있도록 합니다.

네 계층의 결과는 Reciprocal Rank Fusion을 사용하여 융합 정렬됩니다. 코드 예시는 다음과 같은 계층적 주입 로직을 따릅니다:

# tiered_context_injector.py의 실제 디자인 패턴
def inject_into_prompt(query: str) -> str:
    # 먼저 의도를 판단하여 검색 패밀리(Retrieval Family)를 선택
...

모든 쿼리가 한꺼번에 쏟아져 나오는 것이 아니라, memory_family_registry.py가 의도에 따라 흐름을 분산합니다. 프로젝트 쿼리는 프로젝트 패밀리로, 시스템 설정은 시스템 패밀리로, 인적 관계는 관계 패밀리로 분류되며 각 계층의 가중치는 다르게 적용됩니다.

설치 프로그램: 세 가지 모드, 중/영 이중 언어 지원

v3.5의 설치 프로그램은 '완전 자동화'부터 '감지만 하고 수정하지 않음'까지 단계별 경로를 제공합니다:

export AGENT_HOME="$HOME/.hermes"
git clone https://github.com/mage0535/hermes-memory-installer.git
cd hermes-memory-installer
...

설치 후 python3 "$AGENT_HOME/scripts/sidecar_acceptance_check.py"를 실행하여 검증하고, 모든 항목이 녹색으로 통과되면 적용됩니다.

추측이 아닌 관측 가능성 (Observability)

v3.5에는 memory_observability_report.py가 새로 추가되었습니다. 이 도구는 governance DB에서 검색 지표를 추출하여, 각 의도 분류별로 독립적인 샘플 수, 평균 지연 시간, P95 지연 시간, 지식 적중률 (Knowledge Hit Rate)을 보여줍니다. 이전에는 검색이 정확하지 않으면 추측에 의존해야 했지만, 이제는 명령어 한 줄로 문제를 파악할 수 있습니다.

KMM과의 경계

hermes-memory-installer는 런타임(Runtime)을 관리합니다 — 즉, 설치, 검색, 컨텍스트 주입을 담당합니다. 지식이 어디서 오고 어떻게 정리할지는 Knowledge-and-Memory-Management의 역할입니다. 두 프로젝트는 역할이 명확히 구분되어 서로 보완적입니다.

만약 여러분도 AI 세션의 기억 상실 문제로 고통받고 있다면, 이 프로젝트를 설치하는 데 10분만 투자해 보시기 바랍니다. GitHub에서 mage0535/hermes-memory-installer를 검색하세요. MIT 라이선스입니다.

AI 자동 생성 콘텐츠

원문 바로가기