본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 31. 03:11

AI 오케스트레이터의 두뇌를 Hermes Agent로 교체하면 어떤 일이 벌어질까

요약

자율형 AI 데몬인 Colony의 두뇌를 Anthropic의 Claude CLI에서 오픈 소스 Hermes Agent로 교체한 사례를 다룹니다. Hermes Agent의 도구 사용 능력과 모델 불가지론적 특성을 활용해 비용 절감 및 웹 검색, 파일 작업이 가능한 자율적 콘텐츠 파이프라인을 구축하는 과정을 설명합니다.

핵심 포인트

  • Hermes Agent는 웹 검색, 터미널, 브라우저 자동화 등 내장 도구를 지원함
  • Ollama, OpenAI, Anthropic 등 다양한 모델을 지원하는 모델 불가지론적 설계
  • 원샷 모드(-z 플래그)를 통해 서브프로세스 오케스트레이션에 최적화됨
  • 리서치부터 아웃라인 작성까지 이어지는 자율적 콘텐츠 파이프라인 구현 가능

설정 (The Setup)

저에게는 문제가 하나 있습니다. 좋은 문제이긴 하지만, 여전히 문제입니다.

저는 Colony라는 자율형 AI 데몬 (AI daemon)을 구축했습니다. 이는 블로그 기사 작성, 웹사이트 모니터링, 수익 기회 조사와 같은 작업 큐 (queue of tasks)를 관리하고, 이를 서브프로세스 (subprocesses)로 실행되는 AI 워커 (AI workers)에게 위임하는 Clojure 애플리케이션입니다. cron과 AI, 그리고 "만약 내가 다시는 SEO 콘텐츠를 쓸 필요가 없다면 어떨까"라는 생각이 만난 것이라고 생각하면 됩니다.

수개월 동안 Colony의 배후에 있는 두뇌는 Anthropic의 프롬프트 모드 실행 CLI 도구인 claude -p였습니다. 잘 작동했지만, 몇 가지 한계가 있었습니다:

  • 비용 (Cost): 모든 조사 쿼리, 모든 초안, 모든 수정 작업이 API 토큰을 소모했습니다.
  • 도구 접근 권한 없음 (No tool access): 프롬프트 모드의 Claude CLI는 웹을 탐색하거나 명령어를 실행할 수 없습니다.
  • 단일 모델 (Single model): Anthropic이 제공하는 것에만 국한되며, 로컬 모델 (local model)로의 폴백 (fallback)이 불가능합니다.

그러다 Hermes Agent를 발견했습니다.

Hermes Agent란 정확히 무엇인가?

아직 접해보지 못하셨다면: Hermes Agent는 Nous Research에서 만든 오픈 소스 에이전트 시스템 (agentic system)입니다. 제 눈길을 끌었던 핵심 차별점은 다음과 같습니다:

  1. 내장된 도구 사용 (Built-in tool use) — 웹 검색, 터미널 명령어, 파일 작업, 브라우저 자동화가 즉시 가능합니다.
  2. 모델 불가지론 (Model agnostic) — Ollama, OpenRouter, Anthropic, OpenAI, 로컬 llama.cpp 등을 지원합니다. 플래그 (flag) 하나로 전환할 수 있습니다.
  3. 기술 시스템 (Skill system) — GitHub PR부터 Minecraft 모딩에 이르기까지 90개 이상의 번들링된 기술 (skills)을 제공합니다.
  4. 원샷 모드 (One-shot mode)hermes -z "do the thing"은 전체 도구 접근 권한을 가진 상태로 프롬프트를 실행하고 종료됩니다. 서브프로세스 오케스트레이션 (subprocess orchestration)에 완벽합니다.

마지막 포인트가 통합을 가능하게 만든 결정적인 이유였습니다. Colony는 지속적인 채팅 세션이 필요한 것이 아니라, 작업을 실행하고 결과를 수집하기를 원합니다. Hermes의 -z 플래그가 바로 그 인터페이스 역할을 합니다.

교체 (The Swap)

Colony의 워커 스크립트에서 claude -phermes -z로 교체하는 작업은 부끄러울 정도로 간단했습니다. 제 Babashka 워커의 핵심 변경 사항은 다음과 같습니다:

;; 이전: Claude CLI
(proc/process {:out :string :err :string}
  "claude" "-p" prompt)
...

하지만 진정한 힘은 교체 자체에 있는 것이 아니라, Hermes가 Claude CLI로는 할 수 없게 만드는 능력에 있습니다.

콘텐츠 파이프라인

Hermes 통합을 통해 제가 구축한 것은 3단계의 자율적인 콘텐츠 파이프라인입니다.

1단계: 리서치(Research) — Hermes는 웹 검색 도구를 사용하여 특정 분야의 트렌드 주제를 찾습니다. 그리고 제목, 키워드, 검색량 힌트, 경쟁 분석을 포함하는 구조화된 JSON을 반환합니다.

2단계: 아웃라인(Outline) — Hermes는 선택한 주제에 대해 상위 랭크 기사들을 조사한 다음, 기존 콘텐츠보다 더 넓은 범위를 다루는 포괄적인 개요를 생성합니다.

3단계: 작성(Write) — Hermes는 프런트매터(frontmatter), 적절한 헤딩 구조, 그리고 SEO 최적화된 콘텐츠가 포함된 전체 마크다운 기사를 생성합니다.

각 단계는 별도의 Hermes 호출입니다. 이것이 중요한 이유는 다음과 같습니다:

단계별로 다른 모델 사용 가능

Research → hermes3:8b (로컬, 무료, 빠름)
Outline  → hermes3:8b (로컬, 무료, 빠름)
Writing  → claude-opus-4.6 (클라우드, 유료, 고품질)

리서치 단계에는 최첨단 모델(frontier model)이 필요하지 않습니다. 주제 발견 및 경쟁 분석은 Ollama에서 로컬로 실행되는 8B 파라미터 모델로도 충분히 작동합니다. 비싼 토큰은 문장 품질이 중요한 최종 기사 작성에 아껴 쓸 수 있습니다.

이는 claude -p로는 불가능했습니다. 모든 것을 하나의 모델, 하나의 가격대로 처리해야 했기 때문입니다.

에이전트 구조(Agentic Architecture)를 통해 배운 점

1. 개별 단계 > 거대 프롬프트 (Stages > Mega-Prompts)

처음에는 단일 프롬프트를 사용하려는 경향이 있었습니다:

Ollama에서 실행되는 Hermes3:8b는 주제 조사(topic research)를 놀라울 정도로 잘 처리했습니다. 전문적인 블로그 게시물 수준의 산문을 작성하지는 못하지만, 구조화된 작업 — JSON 주제 목록 생성, 키워드 격차(keyword gaps) 분석, 개요 작성 — 에 있어서는 충분한 역량을 갖추고 있습니다.

비용 차이는 극명합니다. 로컬 모델(local model)을 이용한 조사는 비용이 0달러입니다. 클라우드 모델을 이용한 조사는 토큰(tokens) 비용이 발생합니다. 몇 시간마다 주제를 조사하는 자율 데몬(autonomous daemon)을 실행할 때는 이 비용이 상당해집니다.

3. 도구 접근성(Tool Access)이 모든 것을 바꾼다

claude -p에서 Hermes로 전환하며 얻은 가장 큰 업그레이드는 모델 자체가 아니라 도구(tools)였습니다. Hermes는 다음과 같은 작업을 수행할 수 있습니다:

  • 웹 검색 (Search the web): 최신 정보를 위해 웹을 검색 (프롬프트 모드의 Claude CLI는 불가능)
  • 터미널 명령 실행 (Run terminal commands): 사이트 상태 확인, git 작업, 파일 처리 등
  • 웹사이트 브라우징 (Browse websites): 경쟁사 콘텐츠 분석을 위한 웹사이트 탐색

이를 통해 저의 콘텐츠 파이프라인(content pipeline)은 "학습 데이터로부터 텍스트 생성"에서 "최신 트렌드를 조사하고 정보에 기반한 텍스트 생성"으로 변모했습니다. 출력 품질의 차이는 상당합니다.

4. 서브프로세스 오케스트레이션 (Subprocess Orchestration)은 과소평가되어 있다

대부분의 에이전트 프레임워크(agentic frameworks)는 사용자가 장시간 지속되는 채팅 세션이나 복잡한 멀티 에이전트 그래프(multi-agent graph)를 원한다고 가정합니다. Colony는 더 단순한 접근 방식을 취합니다: 서브프로세스 워커(subprocess workers)를 가진 작업 큐(task queue) 방식입니다.

데몬 (Daemon, 장시간 실행) → 작업 할당
워커 (Worker, 서브프로세스) → hermes -z 실행 → 결과 보고
데몬 (Daemon) → 결과 처리, 다음 작업 큐에 추가

이 방식은 다음과 같은 이점을 제공합니다:

  • 프로세스 격리 (Process isolation): 멈춰버린 워커를 데몬에 영향을 주지 않고 종료할 수 있음
  • 리소스 제어 (Resource control): 서브프로세스 개수에 따라 동시 워커 수 제한 가능
  • 언어 유연성 (Language flexibility): 데몬은 Clojure, 워커는 Babashka 또는 Python, LLM은 Hermes 사용 가능
  • 깔끔한 실패 모드 (Clean failure modes): 예외 전파(exception propagation)가 아닌 종료 코드(exit codes)와 IPC 메시지 활용

Hermes의 -z 원샷(one-shot) 모드는 이 패턴에 완벽하게 부합합니다. 이는 도구 접근 권한을 가진 함수 호출(function call)과 같습니다.

5. 스킬 생태계는 승수 효과 (Force Multiplier)를 일으킨다

Hermes는 연구(research), GitHub, 코드 리뷰(code review), 콘텐츠 생성(content creation) 및 수십 가지의 다른 도메인을 위한 스킬(skills)을 탑재하여 출시됩니다. 저는 아직 이 기능들의 대부분을 활용해 보지는 못했지만, blogwatcher, research, arxiv 스킬을 사용할 수 있다는 것은 커스텀 도구 통합(custom tool integrations) 코드를 직접 작성하지 않고도 파이프라인을 확장할 수 있음을 의미합니다.

콘텐츠 파이프라인에 학술 논문 요약 기능을 추가하고 싶으신가요? 이를 위한 스킬이 있습니다. 기사 아이디어를 위해 GitHub 이슈(issues)를 자동으로 생성하고 싶으신가요? 그 또한 스킬로 가능합니다.

수치 데이터 (The Numbers)

Hermes3:8b + Ollama를 사용하여 로컬에서 파이프라인을 실행한 결과입니다:

단계시간비용품질
연구 (주제 3개)~45초$0좋음 — 관련성 있고 최신인 주제
...
전체 파이프라인3분 미만초안 작성 비용 거의 제로

Hermes Agent를 사용해야 할까요?

만약 다음과 같은 특성을 가진 어떤 종류의 에이전트 시스템(agentic system)을 구축하고 있다면:

  • 도구 접근 권한이 필요한 경우 (웹 검색, 터미널, 파일 작업)
  • 모델 유연성(로컬 + 클라우드)의 이점을 얻고자 하는 경우
  • 채팅 세션(chat sessions)보다는 서브프로세스 오케스트레이션(subprocess orchestration)을 사용하는 경우
  • 스킬/플러그인 생태계(skill/plugin ecosystem)를 원하는 경우

그렇다면 네, Hermes Agent는 충분히 투자할 가치가 있습니다. 설치는 명령어 한 줄로 끝나며, -z 원샷 모드(one-shot mode)는 자동화에 완벽하고, 모델 불가지론적(model-agnostic) 설계 덕분에 특정 제공업체에 종속되지 않습니다.

오픈 소스(open-source) 측면도 중요합니다. 자율적인 AI 워커(autonomous AI workers)를 실행할 때는 스택의 모든 계층을 이해하고(그리고 수정할 수) 있어야 합니다. Hermes는 바로 그 점을 제공합니다.

직접 시도해 보세요

# 설치
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

...

그런 다음 무언가를 만들어 보세요. 챌린지 마감일은 2026년 5월 31일이지만, 진정한 가치는 유능한 오픈 소스 에이전트를 여러분의 도구 상자에 영구적으로 보유하게 된다는 점에 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0