본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 28. 07:49

Hermes Memory Providers: 초보자를 위한 완전 분석

요약

Hermes 에이전트의 메모리 시스템인 내장 메모리와 8가지 외부 제공자를 상세히 분석합니다. 사용자의 환경과 목적에 맞는 최적의 메모리 설정을 선택할 수 있도록 구조와 비용, 용도를 가이드합니다.

핵심 포인트

  • 내장 메모리는 비용 없이 항상 활성화되며 에이전트가 자동 관리함
  • MEMORY.md와 USER.md를 통해 환경 정보와 사용자 프로필을 저장함
  • 외부 제공자는 지식 공유, 긴 대화, 구조화된 검색이 필요할 때 사용함
  • 한 번에 하나의 외부 제공자만 활성화하여 내장 메모리 위에 레이어로 사용 가능

Hermes에는 정말 많은 메모리 옵션이 있습니다. 처음 접하는 사용자라면 내장 메모리(built-in memory), 8개의 외부 제공자(external providers), 서로 다른 비용, 서로 다른 아키텍처 등 선택지가 너무 많아 압도될 수 있습니다. 이 가이드는 여러분이 자신의 설정에 맞는 올바른 결정을 내릴 수 있도록 모든 내용을 분석해 드립니다.

첫 번째: 내장 메모리 (항상 활성화됨)

제공자(providers)에 대해 이야기하기 전에, 내장 메모리는 항상 켜져 있다는 점을 이해해야 합니다. 비용이 들지 않고, 설정이 필요 없으며, 즉시 사용할 수 있습니다.

~/.hermes/memories/ 경로에 있는 두 개의 파일:

파일용도글자 수 제한
MEMORY.md에이전트의 노트 — 환경 정보, 프로젝트 컨벤션 (conventions), 학습된 교훈2,200자 (~800 토큰)
USER.md사용자 프로필 — 이름, 선호도, 커뮤니케이션 스타일1,375자 (~500 토큰)

두 파일 모두 매 세션 시작 시 시스템 프롬프트(system prompt)에 주입됩니다. 에이전트가 이를 자동으로 관리합니다. 즉, 사용자가 수정한 선호도, 발견한 환경 정보, 학습한 컨벤션 등을 스스로 저장합니다.

주요 세부 사항:

  • 항목은 § 구분자로 분리됩니다.
  • 헤더에 사용량 %가 표시됩니다 (예: MEMORY [67% — 1,474/2,200 chars]).
  • 용량이 80%를 초과하면, 에이전트는 새로운 내용을 추가하기 전에 내용을 통합(consolidate)해야 합니다.
  • 중복된 항목은 자동으로 거부됩니다.
  • 보안을 위해 항목 내 인젝션(injection)/데이터 유출(exfiltration) 패턴을 스캔합니다.
  • 변경 사항은 즉시 디스크에 저장되지만, 시스템 프롬프트에는 다음 세션부터 반영됩니다 (frozen snapshot — LLM 프리픽스 캐시(prefix cache)를 보존하기 위함).

대부분의 신규 사용자에게는 내장 메모리만으로도 충분합니다. 선호도, 프로젝트 정보, 일상적인 워크플로우 노트를 처리할 수 있습니다. 개인용 비서 설정을 위해서는 외부 제공자가 필요하지 않습니다.

하지만 다음과 같은 경우에는 외부 제공자가 필요할 것입니다:

  • 지식을 공유해야 하는 여러 개의 Hermes 프로필을 가지고 있는 경우
  • 에이전트가 세션 전반에 걸쳐 자동으로 학습하고 종합(synthesize)하기를 원하는 경우
  • 컨텍스트 제한(context limits)을 초과하는 긴 대화를 진행하는 경우
  • 구조화된 지식 검색(structured knowledge retrieval)이 필요한 경우 (단순한 텍스트 덩어리가 아닌 엔티티(entities) 및 관계(relationships) 중심)

8개의 외부 메모리 제공자

모든 외부 제공자(external providers)는 다음 명령어를 통해 설치됩니다:

hermes memory setup      # 대화형 선택기 (interactive picker)
hermes memory status     # 활성화 상태 확인
hermes memory off        # 비활성화

또는 ~/.hermes/config.yaml에서 수동으로 설정할 수 있습니다:

memory:
  provider: hindsight    # 또는 8개 중 하나 선택

중요: 한 번에 오직 _하나_의 외부 제공자만 활성화할 수 있습니다. 모든 제공자는 내장 메모리 (built-in memory) 위에 레이어로 쌓이는 방식이며, 이를 대체하는 것이 아닙니다.

빠른 비교

제공자 (Provider)저장소 (Storage)비용 (Cost)고유한 특징 (Unique Angle)최적 용도 (Best For)
Hindsight로컬/클라우드 (Local/Cloud)무료 (로컬)지식 그래프 (Knowledge graph) + 성찰적 합성 (reflect synthesis)최고 수준의 정확도, 개인정보 보호
...

벤치마크 스냅샷

현재 두 개의 제공자만이 LongMemEval 점수를 공개했습니다:

제공자 (Provider)점수 (Score)모델 (Model)
Hindsight91.4%Gemini-3
...

Hindsight는 명확한 검색 정확도(retrieval accuracy)의 선두주자입니다. 다른 제공자들은 이와 비교 가능한 벤치마크를 공개하지 않았습니다.

제공자 심층 분석 (Provider Deep Dives)

🥇 Hindsight

로컬 환경과 정확도를 모두 원하는 대부분의 사용자에게 가장 좋은 올라운드 선택지입니다.

가공되지 않은 텍스트 청크 (raw text chunks)가 아닌, 구조화된 지식(structured knowledge) — 즉, 개별 사실(discrete facts), 고유 명사 엔티티(named entities), 그리고 관계(relationships) — 를 저장합니다. 이 제공자만의 고유한 hindsight_reflect 도구는 모든 메모리에 걸쳐 고차원적인 통찰(higher-level insights)을 주기적으로 합성합니다. 에이전트가 시간이 지남에 따라 개인용 지식 그래프 (personal knowledge graph)를 구축하는 것이라고 생각하면 됩니다.

설정:  hermes memory setup → Hindsight 선택
        로컬 데몬 (local daemon)을 위해 빈칸으로 두거나, 클라우드 사용을 위해 HINDSIGHT_API_KEY 설정
도구:  hindsight_recall, hindsight_retain, hindsight_reflect
...

이런 경우에 최적: 최고 수준의 검색 정확도를 원하거나, 구조화된 지식이 필요하거나, 개인정보에 민감한 데이터를 다루는 경우.

Holographic

의존성 제로 (Zero dependencies). 기기 외부로 나가는 데이터가 전혀 없습니다. 말 그대로 두 개의 도구만 있으면 끝납니다.

Holographic Reduced Representations (HRR)를 사용합니다 — 메모리는 중첩된 복소수 벡터 (superposed complex-valued vectors) 형태로 저장됩니다. 회상 (Recall)은 유사도 기반이 아닌 대수적 (algebraic) 방식으로 이루어집니다. 신뢰 점수 산정 메커니즘 (trust-scoring mechanism)을 통해 확인된 메모리는 가중치가 증가하고, 모순된 메모리는 시간이 지남에 따라 감쇠합니다.

설정: hermes memory setup → Holographic 선택. 그게 전부입니다. API 키도 필요 없습니다.
도구: 2개의 도구 (설계 단계부터 최소화됨)
비용: 무료. 로컬 SQLite 사용. 끝.

이런 경우에 최적입니다: 에어갭 (air-gapped) 환경에 있거나, 외부 의존성을 싫어하거나, 무엇이 신뢰할 수 있는지 학습하는 자기 교정형 메모리 (self-correcting memory)를 원하는 경우.

OpenViking

토큰 절약 도구. ByteDance에서 만든 셀프 호스팅 컨텍스트 데이터베이스입니다.

계층적 로딩 (tiered loading)을 갖춘 파일 시스템 스타일의 계층 구조가 핵심 특징입니다:

  • L0 (Abstract): 약 100 토큰 — 매 턴마다 로드됨
  • L1 (Overview): 약 2k 토큰 — 계획 (planning) 단계에서 로드됨
  • L2 (Full): 전체 콘텐츠 — 심층적인 컨텍스트가 필요할 때만 로드됨

이는 매 턴 전체 컨텍스트를 로드하는 것과 비교했을 때 80-90%의 토큰 비용 절감을 의미합니다. 메모리를 프로필 (profile), 선호도 (preferences), 엔티티 (entities), 이벤트 (events), 사례 (cases), 패턴 (patterns)의 6가지 카테고리로 자동 추출합니다.

설정: pip install openviking
        openviking-server
        hermes memory setup → OpenViking 선택
...

이런 경우에 최적입니다: 대규모로 운영 중이거나, 셀프 호스팅 인프라를 원하거나, 토큰 비용을 최소화해야 하는 경우.

Mem0

"그냥 바로 작동하는" 옵션. 실행까지 단 30초가 걸립니다.

서버 측 LLM 추출 방식을 사용하므로 Mem0의 인프라가 무엇을 유지할지 결정합니다. 메모리 오류가 에이전트의 응답을 차단하지 않도록 서킷 브레이커 (circuit breaker)가 포함되어 있습니다. 이중 메모리 범위 (session + user)를 통해 단기 컨텍스트와 장기 사실을 분리합니다.

설정: hermes memory setup → Mem0 선택
        Set MEM0_API_KEY=your-key
도구: mem0_add, mem0_search, mem0_get_all
...

이런 경우에 최적입니다: 가장 빠른 설정을 원하고, 셀프 호스팅을 원하지 않으며, 클라우드 스토리지를 사용하는 것에 거부감이 없는 경우. 좋은 시작점입니다 — 나중에 언제든 마이그레이션할 수 있습니다.

Honcho

철학자. 당신이 무엇을 아는지뿐만 아니라, 어떻게 _생각하는지_에 대한 모델을 구축합니다.

변증법적 사용자 모델링 (Dialectic user modeling)은 시간이 흐름에 따라 추론 패턴, 의사소통 스타일, 의사결정 성향을 포착합니다. 설정 가능한 갱신 주기(cadences)를 가진 2계층 컨텍스트 주입 (Two-layer context injection) 방식을 사용합니다. Hermes 프로필당 별도의 AI 동료를 두는 멀티 에이전트 (multi-agent) 설정을 지원합니다.

Setup:  hermes memory setup → select Honcho
        Set HONCHO_API_KEY=your-key
Tools:  honcho_profile, honcho_search, honcho_context, honcho_reasoning, honcho_conclude
...

⚠️ 라이선스 참고 사항: 오픈 소스 소프트웨어 (OSS)는 AGPL v3.0입니다. 네트워크 앱에서 셀프 호스팅 (Self-hosting)을 하려면 소스 코드를 AGPL에 따라 공개해야 합니다. 관리형 클라우드 (managed cloud)를 사용하면 이를 피할 수 있습니다.

가장 적합한 경우: 시간이 지남에 따라 당신에 대한 모델을 심화시켜야 하는 개인용 비서를 구축하거나, 공유된 사용자 컨텍스트를 가진 멀티 에이전트 시스템을 운영하는 경우.

ByteRover

읽기 가능한 Markdown으로 저장되는 당신의 지식. 블랙박스는 없습니다.

계층적 지식 트리 (Hierarchical knowledge tree)가 .brv/context-tree/ 내에 사람이 읽을 수 있는 Markdown 파일로 저장됩니다. 고유한 사전 압축 추출 훅 (pre-compression extraction hook)이 Hermes가 긴 대화를 압축하기 _전_에 실행되어, 컨텍스트가 요약되어 사라지기 전에 지식을 포착합니다.

Setup:  hermes memory setup → select ByteRover
Tools:  byterover_search, byterover_list, byterover_forget
Cost:   Freemium

가장 적합한 경우: 저장된 메모리에 대한 완전한 가시성을 원하거나, 압축으로 인해 지식이 손실되기 전에 긴 대화로부터 지식을 포착해야 하는 경우.

RetainDB

검색 전문가의 선택. 하이브리드 벡터 (Hybrid vector) + BM25 + 재순위화 (reranking).

최고 품질의 검색 결과를 위해 여러 검색 전략을 결합합니다. 벡터 유사도 (Vector similarity)는 의미론적 일치 (semantic matches)를 포착하고, BM25는 정확한 키워드 일치 (exact keyword matches)를 포착하며, 재순위화 (reranking)는 가장 좋은 결과를 상단에 배치합니다.

Setup:  hermes memory setup → select RetainDB
Tools:  retaindb_search, retaindb_store
Cost:   Paid

가장 적합한 경우: 검색 품질이 최우선 순위이며 이를 위해 비용을 지불할 의사가 있는 경우.

SuperMemory

웹 리서치 워크플로. 브라우저 통합형 메모리.

브라우저로 확장되는 메모리를 위해 설계되었습니다. 지식 베이스 (Knowledge Base)의 일부로서 웹 콘텐츠를 캡처하고 검색합니다.

Setup:  hermes memory setup → select SuperMemory
Cost:   supermemory.ai 가격 정책 참조

가장 적합한 경우: 워크플로에 웹 리서치 (Web Research) 비중이 높고, 온라인 콘텐츠에 대한 지속적인 메모리를 원하는 경우.

비용 요약 (Cost Summary)

등급 (Tier)제공자 (Providers)비고
무료, 로컬 (Free, local)Holographic, Hindsight (local), OpenVikingAPI 키 불필요, 클라우드 미사용. Holographic이 가장 선택하기 쉽습니다.
...

나의 추천 (My Recommendations)

이제 막 시작하셨나요?
내장 메모리 (Built-in memory)를 사용하세요. 사용 사례의 80%를 커버합니다. 외부 제공자 (External provider)는 내장 메모리의 한계에 부딪혔을 때만 추가하세요.

최고의 무료 로컬 경험을 원하시나요?
Hindsight (local daemon). 최고의 벤치마크 (Benchmarks) 성능을 보여주며, 데이터가 기기를 벗어나지 않고 구조화된 지식 그래프 (Knowledge Graph)를 제공합니다.

설정 과정이 전혀 없는 것을 원하시나요?
Holographic. hermes memory setup에서 선택하기만 하면 끝납니다. API 키도, 서버도 필요 없습니다.

가장 쉬운 클라우드 설정을 원하시나요?
Mem0. 30초면 완료되며, 무료 티어 (Free tier)를 제공하고, 자동 추출 (Hands-off extraction)이 가능합니다.

멀티 에이전트 (Multi-agent)를 실행하거나 심층적인 사용자 모델링 (User modeling)을 원하시나요?
Honcho. 변증법적 추론 (Dialectic reasoning) 방식이 다른 모든 제공자와 진정으로 차별화됩니다.

대규모 운영 시 토큰 비용이 걱정되시나요?
OpenViking의 계층적 로딩 (Tiered loading) 방식은 토큰 비용을 80~90% 절감해 줄 것입니다.

제공자 간 마이그레이션 (Migrating Between Providers)

전환 방법은 간단합니다:

hermes memory setup      # 새로운 제공자 선택
hermes memory status     # 활성화 여부 확인

어떤 외부 제공자를 사용하든 귀하의 내장 메모리 (MEMORY.md, USER.md)는 온전하게 유지됩니다. 단, 외부 제공자는 자체 백엔드 (Backend)에 데이터를 저장한다는 점에 유의하세요. 즉, 제공자를 전환한다는 것은 새로운 제공자의 지식 베이스로 새롭게 시작함을 의미합니다. 아직 제공자 간 자동 마이그레이션 기능은 지원되지 않습니다.

질문이 있으신가요?

댓글로 남겨주세요. 귀하의 사용 사례에 맞는 적절한 설정을 선택할 수 있도록 기꺼이 도와드리겠습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0