이 AI 에이전트가 단돈 5달러짜리 VPS에서 돌아간다는 게 믿기지 않습니다 — 월 99달러짜리 프레임워크들을 무색하게 만듭니다 - Insights | Molayo

이 글은 Hermes Agent Challenge를 위한 제출물입니다.

제 머리를 혼란스럽게 만든 것에 대해 이야기해 보겠습니다.

저는 Hermes Agent 문서를 읽으면서, 평소처럼 엄청난 양의 사전 요구 사항(prerequisites)들이 나열되어 있을 것이라고 완전히 예상하고 있었습니다. 여러분도 잘 아는 그런 방식 말이죠 — Python 버전은 정확히 이래야 하고, 먼저 Docker를 설치해야 하며, Node 버전이 맞는지 확인해야 하고, 아 참, 그리고 최소 16GB의 RAM이 필요하니 아니면 그냥 시도조차 하지 말라는 식 말입니다.

대신 제가 발견한 것은 이것이었습니다:

"유일한 사전 요구 사항은 Git입니다. 설치 프로그램이 나머지 모든 것을 자동으로 처리합니다."

그다음 계속 읽어 내려갔습니다. 그리고 이 기능 — 완전 자율적이고, 메모리 지속성(memory-persistent)을 가지며, 멀티 툴(multi-tool)을 사용하고, 스스로 개선되는 AI 에이전트(AI agent) — 를 실행하기 위한 최소 사양이 1 vCPU와 1 GB의 RAM이라고 적혀 있었습니다.

단 1. 기가바이트.

저는 브라우저 확장 프로그램 중에서도 이것보다 더 많은 메모리를 잡아먹는 것들을 본 적이 있습니다. 그런데 여기 Hermes Agent가 있습니다 — 작업을 계획하고, 세션 전반에 걸쳐 당신이 누구인지 기억하며, 웹을 브라우징하고, 코드를 실행하며, Telegram과 Discord에서 동시에 구동되면서도, 한 달에 커피 한 잔 가격으로 빌릴 수 있는 하드웨어에서 매끄럽게 돌아가고 있습니다.

이 부분에 대해 이야기해야겠습니다. 왜냐하면 AI 에이전트 분야에서 실제로 어떤 일이 일어나고 있는지에 대해 충분히 많은 사람들이 주목하고 있지 않다고 생각하기 때문입니다.

먼저, 여러분이 실제로 얻게 되는 것에 대해 이야기해 봅시다

수치에 대해 들어가기 전에, Hermes Agent가 무엇인지 명확히 해둡시다. 왜냐하면 이 에이전트가 수행하는 일과 이를 실행하는 데 드는 비용 사이의 대조가 이 이야기의 핵심이기 때문입니다.

Nous Research에서 구축한 Hermes Agent는 다음과 같은 기능을 갖춘 완전 자율 에이전트입니다:

계획 계층 (Planning layer) — 단순히 반응하는 것이 아니라, 실행하기 전에 작업을 분해합니다.
세션 간 지속적 메모리 (Persistent memory across sessions) — 시간이 지남에 따라 사용자가 누구인지에 대한 모델을 구축합니다.
60개 이상의 내장 도구 (60+ built-in tools) — 웹 검색, 브라우저 제어, 파일 관리, 코드 실행, 이미지 생성, TTS (Text-to-Speech), 원격 터미널, API 호출 등
자기 개선 루프 (A self-improvement loop) — 경험으로부터 '기술 (skills)'을 생성하고 향후 실행 과정에서 이를 정교화합니다.
20개 이상의 메시징 플랫폼 통합 (20+ messaging platform integrations) — Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Email, SMS 등
내장된 cron 스케줄러 (Built-in cron scheduler) — 외부 도구 없이도 자동화된 작업 수행 가능
하위 에이전트 위임 (Subagent delegation) — 복잡한 워크스트림을 위해 병렬 에이전트를 생성합니다.
MCP 지원 (MCP support) — 어떤 MCP 서버든 연결하여 도구 기능을 더욱 확장할 수 있습니다.

이것은 챗봇이 아닙니다. 여러분이 그 주변에 코드를 짜야 하는 프레임워크도 아닙니다. 이것은 여러분이 잠든 동안에도 작동하고, 어제 배운 것을 기억하며, 실행 시간이 길어질수록 여러분의 특정 워크플로우에 맞춰 점점 더 똑똑해지는, 살아 움직이는 에이전트입니다.

이제 이 모든 것을 실행하는 데 무엇이 필요한지 이야기해 보겠습니다.

눈을 의심하게 만들 요구 사항

절대적인 최소 사양: 1 vCPU, 1 GB RAM

Hermes를 클라우드 LLM API (OpenAI, Anthropic, OpenRouter — 선택 사항)에 연결하면, 에이전트 런타임 자체는 놀라울 정도로 가볍습니다. 채팅 전용 인스턴스는 약 **300–600 MB의 상주 메모리 (resident memory)**를 일정하게 유지합니다. 웹 도구 사용을 위해 Chromium이 열려 있는 전체 브라우저 하네스 (browser harness)를 실행하더라도

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

이것이 설치의 전부입니다. "12단계 중 1단계"가 아닙니다. 전체 과정입니다.

Android에서도 실행됩니다. Termux를 통해서 말이죠.

위와 동일한 curl 명령어가 Termux를 자동으로 감지하고 Android에 최적화된 설치 경로로 전환합니다. 시스템 의존성(deps)을 위해 pkg를 사용하고, Android API 레벨에 맞춰 자동으로 빌드하며, 실제로 컴파일되는 내용에 따라 추가 요소를 조정합니다. 사용자가 이 중 어떤 것도 설정할 필요가 없습니다. 시스템이 알아서 판단합니다.

지속적인 메모리 (persistent memory), 60개 이상의 도구 (tools), 그리고 Telegram 연동 기능을 갖춘 자율형 AI 에이전트 (autonomous AI agent)를 단 한 번의 명령으로 당신의 휴대폰에서 실행할 수 있습니다.

WSL2 없는 Windows? 네, 그것도 가능합니다.

네이티브 Windows 지원 (초기 베타 버전)은 PowerShell 한 줄 명령어로 이루어집니다. 설치 프로그램은 PortableGit을 번들로 포함하고 있어, 관리자 권한이 필요 없으며, 시스템 레지스트리를 변경하지도 않고, 기존의 Git 설정을 망가뜨릴 위험도 없습니다. 완전히 격리되어 있으며 독립적으로 작동합니다.

Windows에서 가장 검증된 경로를 원한다면 여전히 WSL2를 권장하지만, 네이티브 Windows에서조차 작동한다는 사실 자체가 이 팀이 진입 장벽을 낮추기 위해 얼마나 진지하게 고민했는지를 보여줍니다.

각 티어(Tier)별 제공 기능 (여기서부터 흥미진진해집니다)

Tier 1 — "$5 VPS" 설정

하드웨어: 1 vCPU, 1–2 GB RAM
비용: 월 약 $3–5
LLM: 클라우드 API (OpenAI / Anthropic / OpenRouter — 사용자의 API 키 필요)

이 레벨에서 실제로 얻을 수 있는 것들:

✅ 60개 이상의 전체 도구 세트 — 웹 검색, 브라우저, 파일 관리, 코드 실행, API 호출
✅ 세션 간 지속적인 메모리 (persistent cross-session memory) — 사용자의 선호도, 프로젝트, 컨텍스트를 기억합니다
✅ 기술 생성 및 자기 개선 루프 (skill creation and self-improvement loop) — 사용 패턴을 통해 기술을 구축하고 정교화합니다
✅ 메시징 게이트웨이 — Telegram, Discord, Slack, WhatsApp, Signal을 한 번에 연결합니다
✅ 내장된 cron — 자동화된 작업, 예약된 에이전트, 핸즈오프 (hands-off) 워크플로우
✅ 24/7 업타임 (uptime) — 노트북이 꺼져 있고, 휴대폰 배터리가 다 되었으며, 당신이 잠든 사이에도 실행됩니다

이것은 기능이 제한된 "스타터 (starter)" 모드가 아닙니다. $5짜리 서버에서 돌아가는 완전한 에이전트입니다.

이것이 무엇을 가능하게 하는지에 대한 실제 사례입니다: 저렴한 VPS에 Hermes를 설정하고, Telegram에 연결한 뒤, 아침마다 GitHub 저장소(repos)를 확인하여 새로운 이슈를 분류(triage)하고, 관련 해결책을 검색한 후 요약된 요약본(digest)을 보내주는 크론 잡(cron job)을 부여하십시오. 이것은 영원히 실행되며, 비용은 불과 몇 센트에 불과하고, 당신은 다시는 이에 대해 신경 쓸 필요가 없습니다. 이것은 데모가 아닙니다. 이것은 프로덕션(production)입니다.

Tier 2 — 쾌적한 1인 개발자 설정

하드웨어: 2 vCPU, 4 GB RAM
비용: 월 약 $10–15

이 단계에서는 더 매끄러운 병렬 서브 에이전트(subagent) 워크스트림(workstreams), 더 큰 컨텍스트 윈도우(context windows, Claude 200k, Gemini 1M)를 위한 더 많은 여유 공간, 그리고 부하 상황에서의 더 빠른 브라우저 도구 응답 속도를 얻을 수 있습니다. 이것은 Hermes를 개인 에이전트 인프라로 사용하는 단일 개발자를 위한 "타협 없는" 최적의 지점(sweet spot)입니다.

Tier 3 — 로컬 모델 설정 (완전한 에어갭, API 비용 제로)

하드웨어: 최소 8 GB RAM, GPU 권장
비용: 기존 보유 기기 (API 비용 영구 제로)

이 부분은 개인정보 보호를 중시하거나 비용에 민감한 사용자들에게 특히 흥미로운 지점입니다. 만약 API 키도, 클라우드도 없이 완전히 에어갭(air-gapped)된 상태로 LLM을 _로컬(locally)_에서 실행하고 싶다면, Hermes는 로컬 추론(inference)을 위해 Ollama에 연결됩니다.

CPU 전용 환경의 8 GB RAM에서는 8B 파라미터 모델이 초당 약 15–20 토큰(tokens/sec)의 속도로 실행됩니다. 개발 및 가벼운 작업에 사용 가능한 수준입니다. 중급 GPU(RTX 3060 12GB 이상)를 추가하면 40–60 토큰/sec에 도달하며, 이는 대화형 다단계 에이전트 루프(multi-step agent loops)를 수행하기에 충분히 빠릅니다.

Apple Silicon 사용자들은 매우 뛰어난 이점을 누립니다. 통합 메모리(unified memory) 덕분에 16 GB RAM을 갖춘 M1 MacBook은 8B 모델을 매끄럽게 실행하며, 32 GB RAM을 갖춘 M2 Pro는 27B 모델을 전혀 무리 없이 처리합니다.

아무도 비교하지 않는 지점

대안적인 환경에 대해 이야기해 봅시다. 왜냐하면 여기서의 차이는 결코 미미하지 않기 때문입니다.

CrewAI — 무료 티어(free tier)에서는 월 50회의 실행(executions)을 제공합니다. 유료 플랜은 월 100회 실행에 25달러부터 시작하여, 5,000회 실행 시 월 99달러까지 확장됩니다. 더 많은 실행이 필요한 경우 영업팀과 별도로 맞춤 견적을 논의해야 합니다. 그리고 여기서 "1회 실행"이란 복잡도와 상관없이 하나의 크루 시작(crew kickoff)을 의미합니다. 즉, 50개의 항목을 배치 처리(batch-process)하면 할당량에서 50회의 실행이 즉시 소진됩니다.

LangGraph / LangSmith — 프레임워크 자체는 오픈 소스(open source)이지만, 관측성(observability)과 프로덕션 배포(production deployment)를 위해서는 사용자당 월 39달러부터 시작하는 LangSmith를 사용해야 하며, 여기에 추가로 트레이스(trace)당 초과 요금이 발생합니다.

AutoGen — 완전히 오픈 소스이며 무료라는 점은 훌륭합니다. 하지만 직접 인프라를 구축 및 유지 관리해야 하고, 도구(tools)를 수동으로 정의해야 하며, 자체적인 배포 패턴을 설정해야 합니다. 숙련된 ML 엔지니어에게는 탁월하지만, 단순히 에이전트를 실행하고 싶은 사람에게는 매우 가파른 진입 장벽이 됩니다.

이제 Hermes Agent를 살펴보겠습니다:

영구 무료. MIT 라이선스.
실행 제한 없음. 실행당 비용 없음. 사용량 제한 없음.
SaaS 가격 계층 없음. "기능 잠금 해제를 위한 업그레이드" 없음.
완전한 셀프 호스팅(self-hostable) 가능 — 당신의 에이전트, 당신의 데이터, 당신의 서버.
60개 이상의 내장 도구 포함. 마켓플레이스나 추가 비용 없음.
메모리(Memory), 기술(skills), 스케줄링(scheduling), 메시징 게이트웨이(messaging gateway) — 이 모든 것이 패키지에 포함되어 있음.

유일한 지속 비용은 LLM API 사용료(어떤 프레임워크를 사용하든 어차피 지불해야 하는 비용)와, 24시간 가동을 원하는 경우 선택 사항인 5달러짜리 VPS뿐입니다.

이것이 전체 그림입니다. 모든 것이 포함되어 있습니다. Hermes에는 아무것도 지불하지 마세요. 원하는 만큼 마음껏 실행하십시오.

	Hermes Agent	CrewAI	LangGraph
기본 비용	무료 (MIT)	무료 티어: 월 50회 실행	무료 (OSS)
...

이것이 돈이 없는 사람들에게 실제로 의미하는 것

이 점이 중요하다고 생각하기 때문에, 솔직하게 말씀드리고 싶습니다.

2026년 AI 툴링(tooling)을 둘러싼 담론에는 조용한 가정이 깔려 있습니다. 바로 진지한 AI 인프라는 막대한 예산을 가진 사람들을 위한 것이라는 점입니다. 월 99달러의 프레임워크 (framework) 구독료를 내는 기업 팀, 클라우드 크레딧을 보유한 투자 유치 스타트업의 개발자, 그리고 GPU 클러스터를 가진 연구자들 말입니다.

Hermes Agent는 바로 그 가정에 대한 직접적인 도전입니다.

월 99달러가 상당한 지출인 국가의 개발자도 실리콘 밸리의 누군가와 동일한 에이전트 (agent)를 실행할 수 있습니다. 학생은 수업 시간 사이에 저렴한 VPS (Virtual Private Server)에서 이를 실행할 수 있습니다. 첫 제품을 부트스트래핑 (bootstrapping)하는 1인 창업자는 단 한 끼 식사 비용으로 자신만의 전체 개인 AI 워크플로우 (workflow)를 구축한 뒤, 그것을 잊어버리고 계속 돌아가게 둘 수 있습니다.

이것이 Android에서 돌아간다는 사실은 매우 중요합니다. 모든 사람이 MacBook을 가지고 있지는 않습니다. 모든 사람이 전용 Linux 서버를 가지고 있지도 않습니다. 하지만 많은 사람이 스마트폰과 한 달에 몇 달러 정도의 여유는 가지고 있습니다.

또한 MIT 라이선스 (MIT-licensed)이기 때문에, 나중에 가격 정책이 변경되어 그 위에서 구축한 모든 것이 새로운 요금제에 인질로 잡히는 상황도 발생하지 않습니다. 오늘 설치하는 것이 바로 당신의 소유가 됩니다.

결론 (The Bottom Line)

저를 사로잡은 것은 단 하나의 기능이 아니었습니다. 모든 내용을 읽어 내려가며 느낀 누적된 효과였습니다. 한 줄짜리 설치 프로그램 (one-line installer), 자동 의존성 처리 (automatic dependency handling), Termux 지원, Windows 네이티브 베타, 5달러짜리 VPS 최소 사양, 그리고 MIT 라이선스에 이르기까지 — 모든 결정이 동일한 방향을 가리키고 있다는 사실을 깨달았을 때였습니다.

누군가는 매우 구체적인 대상을 염두에 두고 이것을 만들었습니다. 바로 무한한 자원은 없지만 무한한 호기심을 가진 사람입니다. 장난감이 아닌 진짜 에이전트를 원하는 개발자, 자율 에이전트 (autonomous agents)가 자신에게 유용한지 확인하기 위해 단지 월 99달러를 지불해야만 하는 상황을 겪고 싶지 않은 빌더 (builder) 말입니다.

당신은 계획하고, 기억하고, 학습하며, 당신이 잠든 동안에도 작동하는 완전 자율 AI 에이전트를 아마 이미 접근 가능한 하드웨어에서 2분 이내에, 그것도 무료로 실행할 수 있습니다.

이것은 사소한 기술적 디테일이 아닙니다. 이것은 가치관의 표명입니다. 그리고 저는 이것이 주목할 만한 가치가 있다고 생각합니다.

직접 사용해 보세요:

작성자 bmaga

이 AI 에이전트가 단돈 5달러짜리 VPS에서 돌아간다는 게 믿기지 않습니다 — 월 99달러짜리 프레임워크들을 무색하게 만듭니다

요약

핵심 포인트