본문으로 건너뛰기

© 2026 Molayo

Zenn헤드라인2026. 06. 26. 09:22

Hermes Agent와 Memanto로 구현하는 AI 에이전트의 영속 메모리 도입

요약

AI 에이전트의 세션별 기억 리셋 문제를 해결하기 위해 Memanto를 활용한 영속 메모리(Persistent Memory) 도입 방법을 소개합니다. Memanto는 로컬 환경에서 동작하는 오픈 소스 도구로, Hermes Agent 등 다양한 에이전트와 연동하여 지시, 사실, 결정 등을 체계적으로 관리할 수 있습니다.

핵심 포인트

  • Memanto는 로컬 완결형으로 프라이버시 보호와 비용 절감이 가능함
  • 기억(remember), 회상(recall), 답변(answer)의 심플한 조작 구조 제공
  • 시간적 메타데이터를 통해 정보의 최신성과 모순을 관리함
  • Docker와 Ollama를 활용하여 미니 PC 환경에서 손쉽게 구축 가능

Hermes Agent와 Memanto로 구현하는 AI 에이전트의 영속 메모리 도입

AI 에이전트는 편리하지만 큰 약점이 있습니다. 바로 세션마다 기억이 리셋된다는 점입니다. Claude Code나 Cursor, Hermes Agent와 같은 AI 지원 도구들은 컨텍스트 윈도우 (Context Window) 범위 내에서만 과거의 대화나 결정을 유지할 수 있습니다. 장시간의 개발이나 지속적인 DX 추진 상황에서는 매번 같은 설명을 반복하거나, 이전의 결정을 재확인해야 하는 낭비가 발생합니다.

저는 2022년부터 개인 사업인 '코바야시 WEB 시스템'으로서 제조업의 DX 안건이나 자사 인프라의 자동 운용에 AI 에이전트를 활용해 왔습니다. 특히 Hermes Agent를 사용한 업무 흐름 자동화에서는 이 '망각'이 병목 현상이 되는 상황에 몇 번이고 직면했습니다. 영속 메모리 (Persistent Memory)를 로컬 환경에서 저렴하게 도입하고 싶다——이 과제를 해결하기 위한 수단으로서, Memanto (메만토)를 도입한 경험을 공유합니다.

Memanto란? 로컬 완결형 AI 에이전트용 영속 메모리

Memanto는 Claude Code, Cursor, Codex, Hermes Agent 등 14종 이상의 AI 에이전트에 대응하는 영속 메모리 도구입니다. 외부의 벡터 데이터베이스 (Vector Database)나 클라우드 백엔드를 필요로 하지 않고, 완전히 로컬 환경에서만 동작합니다. API 키도 필요 없으며, MIT 라이선스의 오픈 소스 소프트웨어 (Open Source Software)로 공개되어 있습니다.

주요 특징은 다음과 같습니다.

3가지 기본 조작: remember (기억), recall (회상), answer (질문에 대한 답변)라는 심플한 설계

13종의 메모리 분류: 지시(instruction), 사실(fact), 결정(decision), 목표(goal), 선호(preference) 등을 타입으로 관리

검색의 즉시성: 쓰기부터 검색까지의 지연이 nearly zero. 인덱스 생성 대기 시간이 없음

프라이버시와 비용: 데이터가 로컬에서만 완결되므로 기밀 정보 유출 리스크가 없고, 클라우드 이용료도 발생하지 않음

기존의 메모리 도구가 '단순히 컨텍스트에 주입하기만 하는 정적 데이터'였던 것에 반해, Memanto는 시간적 감쇠나 모순 검출, 버전 관리를 갖추고 있습니다. 예를 들어 '6개월 전 고객의 선호'와 '어제의 결정'이 동일한 가중치로 취급되는 문제를 시간적 메타데이터 (Metadata)로 해결합니다.

x1lite 상의 Docker + Ollama로 로컬 구성 구축하기

저는 개발·검증 환경으로서 Beelink의 미니 PC (x1lite)에 Ubuntu 24.04를 설치하고, Docker Compose로 여러 서비스를 일원 관리하고 있습니다. Memanto의 로컬 모드 (On-Prem)는 이 Docker 환경과 매우 친화성이 높습니다.

다음과 같은 docker-compose.yml을 통해 Ollama (llama.cpp)와 Memanto 서버를 나란히 실행할 수 있습니다.

services:
ollama:
image: ollama/ollama:latest
...

이 구성에서는 네트워크를 Docker 브리지 (Bridge)에 가둔 채, 로컬호스트 (127.0.0.1)에서만 액세스를 허용합니다. 외부 네트워크에서 직접 포트가 열리는 일은 없으며, x1lite의 Tailscale 등의 출구를 사용하지 않는 한 Private IP도 공개되지 않습니다.

실제 기동과 초기화는 다음 명령어로 수행합니다.

# 컨테이너 기동
docker compose up -d
# 로컬 모드 초기화 (최초 1회)
...

Hermes Agent와 연계한 실운용의 구체적 사례

Memanto의 진가는 AI 에이전트와의 연계에서 발휘됩니다. 저는 Hermes Agent를 업무 자동 운용에 사용하고 있으며, 다음과 같은 상황에서 Memanto를 활용하고 있습니다.

1. 고객별 배경 기억

제조업 DX 안건에서는 고객마다 '어느 공정부터 개선을 시작할지', '기존 CAD 데이터는 어떤 형식인지', '누가 결재권자인지'와 같은 고유 정보가 쌓입니다. Memanto에 고객 ID를 키(Key)로 하여 사실이나 결정을 remember 시켜둠으로써, Hermes Agent는 새로운 세션 시작 시 recall을 통해 배경을 취득하여 처음부터 적절한 제안을 할 수 있는 상태가 됩니다.

2. 개발 진척도와 의사결정 트레이스

자사의 웹 제작이나 기간 시스템 (Core System) 개발에서는 여러 브랜치와 시작(Prototype)이 병행됩니다. "왜 이 라이브러리를 선택했는가", "성능 테스트에서 단념한 접근 방식" 등을 Memanto에 기록해 두면, 세션이 끊겨도 이전의 문맥을 이어받아 개발을 재개할 수 있습니다. "그때 무엇을 검토했는가"를 파일을 다시 읽지 않고도 추출할 수 있기 때문에, 공수(Man-hour) 절감 효과가 현저합니다.

3. 업무 흐름의 정형화와 자동화

DX(Digital Transformation) 로드맵 작성 시에는 경영진과의 협의를 통해 "당분간은 Excel로 진척 관리를 하고, 향후에는 기간 시스템과 연계한다"와 같이 밀도 높은 결정이 내려집니다. 이를 Memanto에 goal이나 commitment로 저장함으로써, Hermes Agent는 일일 보고서 생성이나 주간 진척 확인 상황에서 일관성 있는 제안을 유지할 수 있습니다.

효과: 토큰 비용과 시간 양면에서의 개선

Memanto를 도입하여 특히 실감하고 있는 효과는 두 가지가 있습니다.

  • 컨텍스트 (Context) 단축을 통한 토큰 소비 절감
    세션 시작 시 필요한 배경 정보를 Memanto로부터 Relevance 필터링하여 취득하기 때문에, 방대한 파일 읽기나 이력의 재제시가 줄어듭니다. 개발 팀 내 정보 공유에서도 중복 설명이 감소했습니다.
  • 무인 운용에서도 일관된 판단이 가능해짐
    Hermes Agent가 자동 생성하는 의사록, 주간 보고서, 고객용 자료 등은 Memanto에 저장된 과거의 결정이나 선호도를 바탕으로 구성되므로, 사람이 리뷰할 때의 재작업 (Rework)이 줄어듭니다. 소수 인원의 개발·운용 환경에서 이는 큰 장점입니다.

참고로 벤치마크로서 Memanto 공개처는 LongMemEval에서 89.8%, LoCoMo에서 87.1%를 기록하였으며, Mem0나 Zep 등의 경쟁사를 상회한다고 합니다. 저 자신의 개발 경험에서도 장기적인 개발 업무에 있어서는 실용적인 수준에 도달했다고 느끼고 있습니다.

요약: 로컬·오픈 소스로 DX의 "기억"을 확실하게

AI 에이전트를 업무에 도입할 때 가장 큰 장벽 중 하나가 "기억의 단절"입니다. Memanto는 Docker와 Ollama만 실행할 수 있다면, 추가 비용 없이 이 과제를 해결할 수 있습니다. 홈 서버나 사내 서버로 폐쇄된 환경에서 완결되므로, 컴플라이언스(Compliance)가 엄격한 제조업에서도 도입하기 쉽다는 점이 큽니다.

제가 대표를 맡고 있는 **코바야시 WEB 시스템 (Kobayashi WEB System)**에서는 제조업의 업무 시스템 쇄신, 공정 관리의 디지털화, AI 에이전트의 현장 도입 등을 지원하고 있습니다. "AI를 도입했지만 현장에 좀처럼 정착되지 않는다", "개발 문턱이 높아 사내에서 진행하기 어렵다"와 같은 고민이 있으시다면, 우선 영속 메모리(Persistent Memory)의 구조와 도입 장벽에 대해 무료 상담을 해드리겠습니다.

공개 URL: https://zenn.dev/yutaka8484/articles/kobayashi-20260626-memanto-hermes-agent-memory

Discussion

AI 자동 생성 콘텐츠

본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0