Hermes Agent, OpenClaw를 넘어서다

OpenClaw가 사방에서 압박을 받는 가운데, Hermes Agent가 조용하지만 강력하게 데뷔했습니다. 2026년 2월 말 실리콘밸리 기반의 팀인 Nous Research에 의해 오픈 소스(Open-sourced)로 공개된 이 AI 에이전트 (AI Agent) 프로젝트는 근본적으로 다른 설계 철학을 활용하여 놀라울 정도로 짧은 기간 내에 OpenClaw를 추월했습니다.

차별점 1: "완료 시 초기화"에서 "사용하며 더 똑똑해짐"으로

OpenClaw의 메모리 아키텍처 (Memory architecture)는 오랫동안 개발자들에게 주요 고충 사항이었습니다. 각 세션이 끝날 때마다 에이전트의 메모리는 사실상 제로(0)로 초기화되어, 다음 실행을 위해 축적된 경험이나 사용자 선호도를 전혀 유지하지 못합니다. 반면, Hermes의 핵심 설계 철학은 "당신과 함께 성장하는 에이전트"라는 슬로건에 응축되어 있습니다. 이는 내장된 자기 진화형 학습 루프 (Self-evolving learning loop)를 특징으로 합니다. 복잡한 작업을 완료하면, 에이전트는 실행 궤적 (Execution trajectory)을 자동으로 분석하고, 고빈도 운영 패턴을 식별하며, 성공적인 경험을 사용자의 로컬 저장소 (Local repository)에 저장되는 구조화된 "기술 (Skill)" 파일로 캡슐화합니다. 도구를 5회 이상 호출하거나, 중간 오류 후 자가 치유(Self-healing)를 수행하거나, 명시적인 사용자 수정을 반영하는 등 특정 기준이 트리거되면, 향후 유사한 작업에서 직접 호출할 수 있는 재사용 가능한 기술을 자동으로 생성합니다. 실증 테스트 결과, 3개월간의 연속 운영 후에는 새로운 작업의 65%가 기존 기술을 직접 활용할 수 있게 되어, 실행 효율성과 정확도 모두에서 측정 가능한 개선을 보였습니다.

차별점 2: 사용자 선호도의 교차 플랫폼 연속성을 위한 지속성 메모리 (Persistent Memory)

Hermes는 "3계층 메모리 시스템 (Three-Tier Memory System)"이라 불리는 지속성 아키텍처(persistent architecture)를 기반으로 작동합니다. 작업 메모리 (Working Memory)는 현재 세션의 컨텍스트를 처리하고, 일화 메모리 (Episodic Memory)는 검색을 위해 과거의 세션들을 저장하며, 절차 메모리 (Procedural Memory)는 에이전트 (Agent)가 숙달한 운영 패턴을 공고히 합니다. 결정적으로, 이 메모리 시스템은 플랫폼과 기기를 가로질러 연속성을 유지합니다. WeChat에서 사용자가 선호하는 용어와 명령 스타일은 동일한 기반 메모리 계층에 의해 Feishu (Lark)나 Telegram으로 매끄럽게 이어지며, 반복적인 학습의 필요성을 제거합니다.

차별점 3: 보안 우선 (Security First): 데이터 프라이버시의 기본 원칙 수호

보안 취약점으로 인해 OpenClaw가 직면했던 신뢰 위기와 극명하게 대조적으로, Hermes는 보안 설계에서 완전히 다른 길을 택했습니다. 기본적으로 텔레메트리 (telemetry)를 수집하지 않는 제로 텔레메트리 (zero-telemetry) 원칙, 기밀 정보의 자동 마스킹 (masking), 그리고 WhatsApp에서 낯선 메시지를 기본적으로 거부하는 설계 선택은, 점점 더 엄격해지는 데이터 주권 및 프라이버시 준수 명령 하에 운영되는 기업 및 개인 사용자들에게 매우 강력한 소구력을 가집니다. 현재까지 Hermes Agent에 대해 문서화된 CVE 취약점의 수는 0개로, 이는 오픈 소스 지능형 에이전트 (intelligent agents) 사이에서 매우 보기 드문 안전 기록입니다.

이러한 뚜렷한 장점들은 커뮤니티의 찬사와 시장의 검증으로 직결되었습니다. Hermes는 출시 후 단 45일 만에 GitHub Stars 40,000개를 달성하며, OpenClaw의 61일 기록을 넘어섰습니다. 5월 중순에는 그 수치가 135,000개 스타를 돌파했으며, MIT 라이선스를 채택하고 40개 이상의 즉시 사용 가능한 (out-of-the-box) Skill 모듈을 제공하고 있습니다. OpenRouter의 일일 토큰 볼륨 차트에서 Hermes는 5월 11일, 일일 소비량이 무려 2,710억 토큰에 달하며 공식적으로 OpenClaw를 왕좌에서 끌어내리고 글로벌 1위를 차지했습니다.

더 중요한 점은, Hermes가 자체적인 "상업적 가속기 (commercial accelerator)"를 확보했다는 것입니다. Xiaomi, NVIDIA, StepFun과 같은 주류 모델 제공업체들은 Hermes Agent 프레임워크를 자사의 생태계에 공격적으로 통합해 왔습니다. 그중에서도 Xiaomi의 MiMo 하나만으로도 한 달 만에 Hermes에 무려 1.45조 개의 토큰을 기여했습니다. 이와 동시에 Xiaomi는 글로벌 AI 사용자들을 위해 맞춤화된 100조 토큰 인센티브 프로그램과 에이전트 생태계 공동 구축 이니셔티브 (Agent Ecosystem Co-construction Initiative)를 출시하여, Hermes Agent와 같은 최상위 프레임워크와 자사의 운영을 긴밀하게 연결했습니다. 이는 강력한 플라이휠 효과 (flywheel effect)를 촉진했습니다. 즉, 더 활발한 커뮤니티가 더 큰 토큰 볼륨을 견인하고, 더 큰 토큰 볼륨이 모델 벤더들이 생태계에 참여하도록 유도하며, 더 번영하는 생태계가 최종 사용자의 진입 장벽을 획기적으로 낮추는 선순환 구조를 만든 것입니다.

당연하게도, Hermes에게 완벽함이 없는 것은 아닙니다. 기술 저장소(skill repository)가 팽창하고 작업의 복잡도가 확장됨에 따라, 메모리 시스템의 검색 효율성(retrieval efficiency)은 필연적으로 마찰에 직면하게 될 것입니다. 일부 개발자들은 실제 테스트 과정에서 Agent에게 처음에 가르친 경로에 결함이 있을 경우, 기술 파일(skill file)이 잘못된 방법론을 "학습"하게 되어 성능이 점진적으로 경로를 이탈하게 된다는 점을 지적했습니다. 이러한 "잘못 학습된 습관(mislearned habits)"을 교정하는 것은 에이전트를 처음부터 훈련시키는 것보다 훨씬 더 어렵다는 것이 증명되었으며, 이는 Hermes의 기술 검증(skill validation) 및 오류 수정(error-correction) 메커니즘에 더 높은 요구 사항을 부과합니다. 나아가, 회의론자들은 Hermes의 급격한 부상이 "인위적으로 만들어진 블록버스터(manufactured blockbuster)"의 뚜렷한 특징을 가지고 있다고 주장합니다. Hermes의 WeChat Index와 Baidu Index는 OpenClaw의 과거 데이터와 거의 동일한 급격한 성장 곡선을 보여줍니다. 이러한 "설계된 하이프(engineered hype)" 논리가 상업적으로는 타당할 수 있으나, 이것이 진정으로 장기적인 사용자 유지(user retention)로 이어질 수 있을지는 시간의 관점에서 지켜봐야 할 과제로 남아 있습니다.

Hermes Agent, OpenClaw를 넘어서다

요약

핵심 포인트

댓글