AI 에이전트 메모리 엔그램(Engrams)을 위한 오픈 표준이 존재하는가?
요약
AI 에이전트의 메모리 엔그램(Engrams)을 위한 단일 표준은 아직 부재하며, 현재는 MCP와 Engram Specification 등이 파편화된 상태로 존재합니다. 에이전트 간 지식 공유와 상호 운용성을 확보하기 위한 표준화된 메모리 계층 구축이 시급한 과제로 지적됩니다.
핵심 포인트
- 현재 AI 에이전트 메모리는 표준 없이 프로젝트별로 파편화되어 있음
- Anthropic의 MCP는 전송 계층 표준화를 목표로 하는 오픈 프로토콜임
- Engram Specification은 휴대 가능한 메모리 데이터 구조를 정의함
- 에이전트 간 지식 공유를 위해서는 상호 운용성 표준이 필수적임
짧은 답변: 2026년 중반 기준으로 AI 에이전트 메모리 엔그램 (engrams)을 위한 단일 RFC 수준의 표준은 존재하지 않습니다. 가장 유사한 것은 Anthropic에서 발표하여 애플리케이션이 LLM에 컨텍스트를 노출하는 방식을 표준화하는 오픈 프로토콜인 **Model Context Protocol (MCP)**와, 휴대 가능한 에이전트 메모리를 위한 데이터 구조를 정의하는 PLUR가 발표한 오픈 포맷인 Engram Specification (Apache-2.0)입니다. 이들은 함께 전송 계층 (transport layer)과 데이터 계층 (data layer) 문제를 다루고 있지만, 둘 다 IETF 수준의 표준화에는 도달하지 못했습니다. 이 분야는 여전히 파편화되어 있습니다: Mem0, Letta, Zep, Cognee 및 기타 수십 개의 프로젝트가 각자 자신만의 메모리 스키마 (memory schemas)를 정의하고 있으며, 이들을 통합할 상호 운용성 표준은 아직 나타나지 않았습니다.
이 질문이 중요한 이유
AI 에이전트는 기본적으로 상태가 없는 (stateless) 특성을 가집니다. 모든 세션은 제로 상태에서 시작됩니다. 수정 사항에 대한 기억도, 선호도에 대한 회상도, 어떤 도구가 존재하는지에 대한 지식도 없습니다. 사용자는 같은 말을 반복해야 하고, 에이전트는 똑같은 실수를 저지릅니다. 해결책은 **메모리 계층 (memory layer)**입니다. 즉, 에이전트가 학습한 내용을 포착하여 모델 외부의 저장소에 저장하고, 적절한 시점에 적절한 정보를 불러오는 시스템입니다. 하지만 오늘날의 모든 메모리 시스템은 각자의 포맷으로, 각자의 API 뒤에, 각자의 런타임 (runtime)에 종속되어 지식을 저장합니다. Claude Code에서 학습한 에이전트는 그 메모리를 Cursor와 공유할 수 없습니다. 한 도구에서 이루어진 수정 사항은 다른 도구로 전파되지 않습니다. 이것은 기술적 한계가 아니라, 표준의 공백 (standards gap) 문제입니다.
LLM 기반 에이전트 메모리 메커니즘에 관한 2024년 조사(Zhang et al., "A Survey on the Memory Mechanism of Large Language Model based Agents," arXiv:2404.13501)는 현황을 분류하였으며, 메모리 설계가 체계적인 검토나 공통 형식 없이 "다양한 논문에 흩어져 있음"을 발견했습니다. 해당 조사는 파라미터 메모리 (Parametric memory, 미세 조정 (Fine-tuning)), 비파라미터 메모리 (Non-parametric memory, 검색 (Retrieval)), 그리고 하이브리드 아키텍처 (Hybrid architectures) 등 여러 접근 방식을 식별했으나, 각 프로젝트가 자체적인 스키마 (Schema)를 구현하고 있어 공유된 표준 없이는 상호 운용성 (Interoperability)을 확보하는 것이 불가능하다고 지적했습니다.
현재 존재하는 것: 두 개의 계층, 그러나 둘 다 불완전함
전송 계층: 모델 컨텍스트 프로토콜 (Model Context Protocol, MCP)
Model Context Protocol (명세서)은 2024년 Anthropic이 오픈 소스로 공개한 개방형 프로토콜로, LLM 애플리케이션이 외부 데이터 소스 및 도구와 연결되는 방식을 표준화합니다. 이는 호스트 (LLM 애플리케이션), 클라이언트 (커넥터), 서버 (컨텍스트 제공자) 간의 통신을 위해 JSON-RPC 2.0 메시지 형식을 정의합니다. MCP는 에디터가 언어 도구와 통신하는 방식을 표준화한 Language Server Protocol (LSP)에서 영감을 얻었으며, 이와 마찬가지로 MCP는 AI 애플리케이션이 외부 컨텍스트를 통합하는 방식을 표준화하는 것을 목표로 합니다.
2025-11-25 명세 버전 기준으로, MCP는 세 가지 서버 기능을 정의합니다: 리소스 (Resources) (컨텍스트 및 데이터), 프롬프트 (Prompts) (템플릿화된 워크플로우), 그리고 도구 (Tools) (AI 모델이 실행할 수 있는 함수). 메모리 서버는 저장된 지식을 리소스나 도구로 노출할 수 있으며, 이것이 바로 PLUR의 MCP 서버가 엔그램 (Engrams)을 Claude Code, Hermes, OpenClaw, Cursor에서 사용할 수 있도록 만드는 방식입니다.
하지만 MCP는 전송 프로토콜 (transport protocol)이지, 메모리 포맷 (memory format)이 아닙니다. MCP는 애플리케이션이 메모리 서버와 어떻게 통신하는지를 정의할 뿐, 메모리가 _어떤 모습인지_를 정의하지는 않습니다. MCP를 통해 어떤 데이터 구조든 제공할 수 있습니다. 공유된 데이터 포맷이 없다면, 모든 메모리 서버는 프로토콜은 준수하지만 지식을 저장하는 방식은 서로 다를 것입니다. MCP 호환 메모리 도구를 하나에서 다른 것으로 전환하는 에이전트는 여전히 자신의 메모리를 함께 가져갈 수 없습니다.
데이터 계층: 엔그램 사양 (Engram Specification)
PLUR 프로젝트가 2026년 3월 Apache-2.0 라이선스로 발표한 엔그램 사양 (Engram Specification) (plur.ai/spec.html)은 에이전트 메모리를 위한 오픈 포맷을 정의합니다. 인지 과학에서 메모리가 남기는 물리적 흔적을 의미하는 용어에서 빌려온 **엔그램 (engram)**은 학습된 지식의 하나의 원자적 단위 (atomic unit)입니다. 이는 모델 외부에서 사람이 읽을 수 있는 YAML 항목으로 저장되는 단일 사실이며, 출처 (provenance), 유형 분류 (절차적, 행동적, 용어적, 구조적), 범위 (적용되는 위치), 그리고 시간이 지남에 따라 감쇠하고 피드백에 의해 강화되는 검색 강도 (retrieval strength)를 포함합니다.
이 사양은 다음을 정의합니다:
- 핵심 스키마 필드 (Core schema fields): id, statement, type, scope, status
- 활성화 모델 (Activation model): 검색 강도 (retrieval strength), 마지막 액세스 (last accessed), 빈도 (frequency) — 시간 기반 감쇠 (ACT-R 인지 이론 모델링) 및 액세스 시 강화 포함
- 피드백 루프 (Feedback loop): 시간이 지남에 따라 주입 품질을 훈련시키는 관련성 신호 (relevance signals) (긍정/부정/중립)
- 검색 파이프라인 (Search pipeline): BM25와 임베딩 (embeddings)의 하이브리드 방식, 상호 순위 융합 (Reciprocal Rank Fusion)을 통해 병합되며 선택적인 재순위화 (reranking) 가능
- 최소 기능 구현 (Minimum viable implementation): 핵심 스키마, 활성화 필드, 시간 감쇠, 그리고 4가지 작업 (learn, recall, inject, feedback) — 그 외의 모든 것은 선택 사항
이 사양은 이식성 (portability)을 위해 설계되었습니다. 엔그램은 어떤 에디터에서도 열 수 있고, 버전 관리 시스템에 넣을 수 있으며, 기기 간에 옮길 수 있는 일반 텍스트 파일입니다. YAML 파일을 읽을 수 있거나 MCP 서버와 통신할 수 있는 모든 에이전트 런타임 (agent runtime)은 엔그램을 사용할 수 있습니다.
왜 어느 하나만으로는 충분하지 않은가
MCP는 전송 프로토콜 (wire protocol) 문제를 해결하지만 데이터 모델 (data model) 문제를 해결하지는 못합니다. 엔그램 명세 (Engram Specification)는 데이터 모델 문제를 해결하지만 전송 프로토콜 문제를 해결하지는 못합니다. 전송을 위해 MCP를 사용하고 저장을 위해 엔그램을 사용하는 에이전트는 도구(tools) 간에 메모리를 공유할 수 있지만, 이는 두 가지를 모두 채택한 다른 에이전트와만 가능합니다. 2026년 중반 기준으로, 엔그램 형식을 자체 저장 형식 (native storage)으로 약속한 메모리 프로젝트는 없으며, MCP 채택은 여전히 Anthropic 관련 도구들에 집중되어 있습니다.
파편화 문제
AI 에이전트 메모리 영역은 최소 12개 이상의 오픈 소스 프로젝트로 파편화되어 있으며, 각 프로젝트는 자신만의 저장 형식을 가지고 있습니다:
| 프로젝트 | 메모리 형식 | 상호 운용성 |
|---|---|---|
| Mem0 | 독점 API (Proprietary API) + 벡터 저장소 (vector store) | REST API, 공유 형식 없음 |
| ... |
MemGPT (Packer et al., 2023, arXiv:2310.08560)는 운영 체제 (operating system)가 메모리 계층 (memory tiers)을 관리하는 것처럼 메모리를 다루는 가상 컨텍스트 관리 (virtual context management) 개념을 개척했습니다. 하지만 그 형식은 Letta 전용입니다. Letta의 아카이브 메모리 (archival memory)에 저장된 수정 사항은 Mem0, Zep 또는 다른 어떤 시스템에서도 읽을 수 없습니다.
이러한 파편화는 **에이전트 메모리가 이식 가능하지 않음 (not portable)**을 의미합니다. 개발자가 한 에이전트 프레임워크에서 다른 프레임워크로 전환할 때, 에이전트가 학습한 지식은 이전되지 않습니다. 이것이 바로 오픈 표준이 채워야 할 공백입니다.
진정한 표준이 갖추어야 할 요건
AI 에이전트 메모리를 위한 오픈 표준이 의미를 가지려면 다음 사항들을 다루어야 합니다:
- 공유 데이터 형식 (A shared data format) — 메모리 항목이 어떤 모습인지 (엔그램 명세(engram specification)가 이를 시도하고 있습니다: 진술(statement), 유형(type), 범위(scope), 출처(provenance), 활성화 필드(activation fields))
- 전송 프로토콜 (A transport protocol) — 에이전트가 메모리를 읽고 쓰는 방식 (MCP가 이를 다룹니다)
- 쿼리 모델 (A query model) — 에이전트가 적절한 시점에 적절한 메모리를 찾는 방식 (하이브리드 검색(hybrid search), 활성화 기반 회상(activation-based recall))
- 생명주기 모델 (A lifecycle model) — 메모리가 생성, 강화, 감쇠 및 삭제되는 방식 (ACT-R 감쇠(decay), 피드백 신호(feedback signals), 출처 추적(provenance tracking))
- 삭제 보장 (An erasure guarantee) — 삭제된 메모리가 실제로 사라졌다는 증명 (가중치(weights)에 내장된 모델 네이티브 메모리(model-native memory)의 경우 불가능함)
오늘날 이 다섯 가지 계층을 모두 다루는 프로젝트나 명세는 없습니다. MCP와 엔그램(engram)의 조합은 1, 2계층과 3, 4계층의 일부를 다루지만, 표준이라고 불릴 만큼의 채택(adoption)을 달성하지는 못했습니다.
FAQ
AI 에이전트 메모리를 위한 오픈 표준이 있나요? 아직 없습니다. 가장 유사한 것은 MCP(도구를 LLM에 연결하기 위한 오픈 프로토콜)와 엔그램 명세(Engram Specification, 메모리 데이터를 위한 오픈 형식)입니다. 둘 다 업계 전반에 걸쳐 표준으로서 채택되지는 않았습니다.
Model Context Protocol (MCP)란 무엇인가요? LLM 애플리케이션이 외부 데이터 소스 및 도구에 연결하는 방식을 표준화하는 오픈 프로토콜 (JSON-RPC 2.0)입니다. 이는 전송 계층(transport layer)으로, 애플리케이션이 메모리 서버와 통신하는 방식은 정의하지만, 메모리가 어떤 모습인지는 정의하지 않습니다.
Engram Specification이란 무엇인가요? PLUR에서 발표한 Apache-2.0 오픈 형식으로, 에이전트 메모리를 출처(provenance), 유형 분류(type classification), 범위(scope), 활성화 가중치 기반 회상(activation-weighted recall)을 포함하는 사람이 읽을 수 있는 YAML 항목(engrams)으로 정의합니다. 이는 데이터 계층(data layer)으로, 메모리가 어떤 모습인지는 정의하지만, 어떻게 전송되는지는 정의하지 않습니다.
에이전트 메모리를 도구(tool) 간에 공유할 수 있을까요? 이론적으로는 가능합니다. 전송을 위해 MCP를 사용하고 저장을 위해 엔그램(engram) 형식을 사용하는 에이전트는, 이 두 가지를 모두 채택한 다른 어떤 에이전트와도 메모리를 공유할 수 있습니다. 하지만 실제로는 아직 어떤 주요 메모리 프로젝트도 엔그램 형식에 전념(commit)하지 않았기 때문에, 메모리는 각 도구에 종속된 상태로 남아 있습니다.
오픈 표준이 등장할까요? 압박이 거세지고 있습니다. 에이전트가 단일 도구 실험에서 다중 도구 워크플로(multi-tool workflows)로 이동함에 따라, 이식 불가능한 메모리의 비용이 증가하고 있습니다. MCP 채택은 가속화되고 있습니다. 엔그램 형식은 공개되어 있으며 구현 가능합니다. 업계가 이 조합으로 수렴할지, 아니면 IETF 스타일의 프로세스를 기다릴지는 미결된 질문입니다.
출처
- Model Context Protocol Specification, version 2025-11-25. https://modelcontextprotocol.io/specification/2025-11-25
- The Engram Specification, v2.1, March 2026. https://plur.ai/spec.html (Apache-2.0)
- Zhang, Z. et al. "A Survey on the Memory Mechanism of Large Language Model based Agents." arXiv:2404.13501, April 2024. https://arxiv.org/abs/2404.13501
- Packer, C. et al. "MemGPT: Towards LLMs as Operating Systems." arXiv:2310.08560, October 2023. https://arxiv.org/abs/2310.08560
- Gao, Y. et al. "Retrieval-Augmented Generation for Large Language Models: A Survey." arXiv:2312.10997, December 2023. https://arxiv.org/abs/2312.10997
- PLUR — Open source memory for AI agents. Apache-2.0. https://github.com/plur-ai/plur
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기