GeekNews헤드라인2026. 05. 22. 11:08

agentmemory - AI 코딩 에이전트용 영구 메모리 시스템

요약

AI 코딩 에이전트의 세션 간 컨텍스트 유실 문제를 해결하기 위한 영구 메모리 시스템인 agentmemory를 소개합니다. BM25, Vector, Graph를 결합한 트리플 스트림 검색과 4단계 메모리 계층 구조를 통해 높은 검색 성능과 효율적인 토큰 압축을 제공합니다.

핵심 포인트

세션 종료 후에도 컨텍스트를 유지하는 영구 메모리 시스템
BM25, Vector, Graph 융합 검색으로 높은 R@5 성능 달성
4단계 메모리 계층(Working, Episodic, Semantic, Procedural) 구조
Claude Code, Cursor 등 MCP 및 REST 지원 에이전트와 호환
데이터 압축을 통해 토큰 사용량을 최대 92% 절감

AI 코딩 에이전트가 세션이 끝나면 잊어버리는 문제를 해결
도구 사용을 백그라운드에서 자동 캡처·압축, 다음 세션 시작 시 컨텍스트 주입
매 세션마다 스택·아키텍처
재설명 필요 없음, 내장 메모리(CLAUDE.md)의 200줄 한계와 stale 문제 해소
Claude Code, Cursor, Codex CLI, Gemini CLI 등
MCP·REST 지원 모든 에이전트와 호환, 단일 서버 공유
LongMemEval-S 벤치마크에서
R@5 95.2% (mem0 68.5%, Letta 83.2%)
연 토큰 ~170K, 비용 ~$10 (로컬 임베딩 사용 시 $0)
240 observations 기준 22K+ 토큰 →
~1,900 토큰(92% 감소)

BM25 + Vector + Graph 트리플 스트림 검색을 RRF로 융합

한국어/CJK는
@node-rs/jieba

, tiny-segmenter

설치 시 단어 단위 분할

인간 뇌의 sleep consolidation에서 영감받은
4-Tier 메모리 통합 :

Working(도구 사용을 단기 기억) → Episodic(세션 요약) → Semantic(사실/패턴 추철) → Procedural(워크플로우 와 결정)
51개 MCP 도구 제공

Core:
memory_recall

, memory_save

, memory_smart_search

, memory_patterns

멀티 에이전트:
memory_lease

, memory_signal_send/read

, memory_mesh_sync

거버넌스:
memory_audit

, memory_governance_delete

, memory_snapshot_create

(Git-versioned)

임베딩 Provider 자동 감지: Local
all-MiniLM-L6-v2

(무료·오프라인, BM25-only 대비 +8pp recall), Gemini, OpenAI, Voyage, Cohere, OpenRouter

실시간 뷰어(port 3113) + Session Replay
라이브 observation 스트림, knowledge graph 시각화, 0.5×–4× 속도 재생
Claude Code JSONL transcripts
import-jsonl

로 가져오기 가능

iii 엔진 기반으로
Postgres·Redis·Express·pm2·Prometheus 필요없음
iii worker add

로 pubsub·cron·queue·sandbox·SQL adapter 확장

Apache-2.0 라이선스

댓글과 토론

AI 자동 생성 콘텐츠

원문 바로가기