본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 31. 16:10

50일 만에 52,000★ 달성: AI 에이전트에게 장기 기억(Long-Term Recall)을 부여하는 오픈 소스 메모리 시스템

요약

MemPalace는 대화 데이터를 요약하지 않고 원문 그대로 저장하여 AI 에이전트의 장기 기억력을 극대화하는 오픈 소스 메모리 시스템입니다. 계층적 검색 아키텍처를 통해 LongMemEval R@5에서 96.6%라는 역대 최고 점수를 기록했으며, 100% 로컬 실행으로 비용과 보안 문제를 해결했습니다.

핵심 포인트

  • 요약 방식 대신 원문(Raw) 저장 방식을 채택하여 정보 손실 방지
  • 4단계 계층적 아키텍처를 통한 정밀한 데이터 검색 구현
  • LongMemEval R@5 벤치마크에서 96.6%의 압도적 성능 달성
  • ChromaDB 기반의 100% 로컬 실행으로 API 비용 및 보안 문제 해결
  • Claude Code 등 MCP 환경에서 간편한 설치 지원

요약: MemPalace(52,000★, MIT 라이선스)는 모든 대화 데이터를 압축하는 대신 원문 그대로(raw) 저장하는 AI 에이전트 메모리 시스템입니다. 이를 통해 LongMemEval R@5에서 96.6%(역대 최고 점수)를 달성했습니다. 100% 로컬에서 실행되며, API 비용이 전혀 들지 않고, 단 2개의 명령어로 Claude Code에 설치할 수 있습니다.

지금까지 아무도 해결하지 못한 메모리 문제

현재 AI 에이전트의 문제는 이렇습니다: 그들은 금붕어와 같습니다.

오늘 Claude와 대화하고 창을 닫은 뒤 내일 다시 돌아오면, Claude는 당신이 무슨 이야기를 했는지 전혀 알지 못합니다. 모든 세션은 백지상태에서 시작됩니다.

업계에서는 이를 해결하기 위해 다음과 같은 방법을 시도해 왔습니다:

  • 요약 (Summarization): 대화를 요약본으로 압축 → 세부 사항 손실
  • 벡터 데이터베이스 (Vector DBs): 임베딩 (Embeddings) 저장 → 정확한 회상 (Exact recall) 능력 상실
  • 클라우드 API (Cloud APIs): OpenAI의 메모리 API → 토큰당 비용 발생, 데이터가 기기 외부로 유출

이 세 가지 방식은 모두 동일한 결함을 가지고 있습니다: 정보를 버린다는 점입니다.

지난달, MemPalace라는 프로젝트가 GitHub에 등장하여 다른 방식을 선보였습니다. 이 시스템은 모든 것을 — 원문 그대로, 수정 없이, 손실 없이 (raw, unmodified, lossless) — 저장하며, 계층적 검색 아키텍처 (Hierarchical retrieval architecture)에 의존하여 당신이 필요할 때 정확히 필요한 것을 찾아냅니다.

50일 만에 52,000개의 스타를 기록했습니다. 그 이유는 다음과 같습니다.

MemPalace는 무엇이 다른가?

아키텍처: 디지털 궁전 (Digital Palace)

Palace (전체 AI 에이전트 컨텍스트)
  ├── Wing (프로젝트/주제 카테고리)
  │    ├── Room (세션/태스크)
...

4단계의 계층 구조를 가집니다. 각 단계는 정확한 원본 콘텐츠를 보존합니다.

기능MemPalaceOpenAI Memory요약 기반 (Summary-based)
LongMemEval R@596.6%~72%~65%
...

왜 "원문 저장(Store Raw)" 방식이 승리하는가

다른 모든 메모리 시스템은 저장하기 전에 대화를 요약합니다. 이것이 왜 문제일까요?

사용자: "내 서버 IP는 192.168.1.100이고, SSH 키 경로는 ~/.ssh/prod_key이며, 배포 스크립트는 /opt/deploy.sh에 있어."

요약 기반 시스템이 저장하는 내용: "사용자가 서버 배포에 대해 논의함."
MemPalace가 저장하는 내용: 정확한 텍스트 그대로 (Verbatim).

내일 그 SSH 키 경로를 다시 기억해내야 할 때, 어떤 시스템이 실제로 작동할까요?

설치 방법 (명령어 2개)

pip install mempalace-mcp

# MCP 설정에 추가
...

이 시스템은 벡터 저장소 (Vector Storage)를 위해 내부적으로 ChromaDB를 사용하며, 전체 과정이 사용자의 로컬 머신 (Local Machine)에서 실행됩니다. 클라우드 API도, 데이터 유출도, 월간 청구서도 없습니다.

이것이 모든 것을 바꾸는 지점

1. 코드 프로젝트 (Code Projects)

오늘 프로젝트를 시작하고 다음 주에 다시 시작하더라도, AI는 모든 함수 시그니처 (Function Signature), 발견한 모든 버그, 그리고 당신이 내린 모든 결정을 기억합니다.

2. 연구 (Research)

일주일 동안 50편의 논문을 읽으세요. 3주 뒤에 "37번 논문에 나온 그 LLM의 지연 시간 벤치마크 (Latency Benchmark)가 무엇이었지?"라고 물어보면 정확한 답변을 얻을 수 있습니다.

3. 개인 비서 (Personal Assistant)

당신의 AI 비서는 당신의 선호도, 진행 중인 작업, 가족들의 이름을 기억합니다. 초기화되는 대신 시간이 지날수록 점점 더 나아집니다.

주의사항

아직 초기 단계입니다. GitHub은 현재 연결 문제(별 52,000개를 정점으로 리포지토리에 과부하가 걸림)를 겪고 있습니다. 문서 (Docs)도 최소한으로 제공됩니다. 제대로 설정하려면 Python과 MCP에 익숙해야 합니다.

하지만 객관적인 벤치마크 (Benchmarks)에서 이미 모든 상용 대안을 압도하는 MIT 라이선스 프로젝트라면? 저는 기꺼이 그 정도의 기회비용은 감수할 것입니다.

당신의 AI 에이전트에게 장기 기억 (Long-term Memory)을 부여해 보셨나요? 아래에 댓글을 남겨주세요. 무엇이 효과가 있고(그리고 무엇이 효과가 없는지) 듣고 싶습니다.

이 내용이 유용했다면, 매일 진행되는 오픈 소스 심층 분석을 위해 저를 팔로우하세요. 저는 AI 도구, 개발자 생산성, 그리고 똑똑한 엔지니어들이 실제로 사용하는 프로젝트들을 다룹니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0