FarmRoute Agent — 오류로부터 학습하는 AI 작물 배송 플래너
요약
Hermes Agent를 활용하여 구축된 FarmRoute Agent는 작물 배송 경로를 최적화하고 실시간 돌발 상황에 대응하는 AI 플래너입니다. 과거의 배송 오류와 데이터를 memory.json에 저장하여 스스로 학습하고 개선하는 자가 학습 기능을 갖추고 있습니다.
핵심 포인트
- Hermes Agent를 통한 전체 아키텍처 및 코드 자동 생성
- 과거 오류를 통한 자가 학습 및 위험 점수 업데이트 기능
- 실시간 기상 및 도로 상황을 반영한 다단계 추론 프로세스
- Python Flask와 OpenRouter 기반의 경량화된 기술 스택
이 게시물은 Hermes Agent Challenge를 위한 제출물입니다.
내가 만든 것
FarmRoute Agent v4.0 — 어떤 작물을 먼저 배송할지 결정하고, 10개 마을에 걸친 최적의 경로를 계획하며, 홍수나 도로 폐쇄와 같은 실제 상황의 중단 요소를 처리하고, 과거의 배송 오류로부터 학습하여 스스로 개선하는 AI 기반 농업 배송 플래너입니다.
프로젝트 전체는 Hermes Agent로 구축되었습니다. 저는 Hermes에게 문제를 설명하는 스킬 파일 (skill file)을 제공했습니다. Hermes는 아키텍처를 설계하고, 873줄의 백엔드 (backend) 코드를 작성했으며, 애니메이션 UI를 구축하고, 첫 번째 배송 시뮬레이션을 완전히 스스로 실행했습니다.
해결하는 문제:
농부가 8가지 종류의 부패하기 쉬운 작물(딸기는 12시간 내에 상하고, 감자는 96시간 동안 유지됨)을 가지고 있으며, 서로 다른 기상 조건, 도로 위험, 시간 제한이 있는 10개 마을로 배송해야 합니다. 어떤 작물을 먼저 보내야 할까요? 어떤 경로가 시간을 가장 적게 낭비할까요? 만약 다리가 폐쇄된다면 어떻게 될까요?
FarmRoute Agent는 이 모든 질문에 실시간으로 답합니다.
데모
코드
https://github.com/Suhail-26/farmroute-agent/
나의 기술 스택 (Tech Stack)
- Hermes Agent (Nous Research) — 프로젝트 구축 및 배송 계획 구동
- OpenRouter를 통한 owl-alpha — 무료 LLM 추론 백본 (backbone)
- Python 3.14 + Flask — 시뮬레이션 엔진 (873줄)
- Vanilla HTML/CSS/JS — 애니메이션 터미널 스타일 UI (28KB, 의존성 없음)
- memory.json — 세션 간 지속적인 자가 학습 (self-learning)
Hermes Agent 사용 방법
- Hermes가 프로젝트 전체를 구축함
저는 하나의 skill.md 파일을 만들고 Hermes에 다음과 같이 입력했습니다:
Hermes는 스킬을 읽고, app.py(873줄)를 작성했으며, 애니메이션 UI(28KB)를 구축하고, 메모리 시스템을 생성하고, Flask 서버를 시작하고, 모든 API 엔드포인트를 테스트하고, 제가 단 한 줄의 코드도 작성하지 않고도 첫 번째 완전한 배송 계획을 전달했습니다.
2. Hermes가 모든 배송 과정을 추론함
모든 실행 (RUN)은 25단계 이상의 추론 (reasoning) 단계를 트리거합니다:
- 메모리에서 과거 세션과 학습된 교훈을 회상 (Recalls)
- 8가지 모든 작물의 부패 긴급도 확인
- 10개 모든 마을의 기상 조건 확인
- 계획 수립 전 도로 차단 탐지
- OpenRouter를 통한 LLM 사고의 흐름 (Chain-of-thought) 계획 실행
- 보너스가 포함된 점수화된 배송 보고서 생성
모든 단계는 애니메이션 추론 피드 (reasoning feed)를 통해 시각화됩니다 —
여러분은 Hermes가 실시간으로 생각하는 과정을 지켜보게 됩니다.
3. Hermes는 자신의 오류로부터 학습합니다
모든 세션은 memory.json에 저장됩니다. 에이전트는 다음을 통해 학습합니다:
- 차단 (Disruptions) → 다음 실행 시 해당 마을의 위험 점수 (risk score) 증가
- 심각한 부패 (Critical spoilage) → 작물 우선순위 편향 (priority bias) 증가
- 낮은 점수 (Low scores) → 사람이 읽을 수 있는 교훈 (lesson) 생성
학습 내용이 최신 상태로 유지되도록 편향은 실행당 0.95배씩 감소 (decay)합니다. 10번의 실행 후에는 에이전트가 개선되는 모습을 확인할 수 있습니다 — 우선순위 바 (priority bars)가 이동하고, 교훈이 축적되며, 점수가 상승 곡선을 그립니다. 이것이 실제 물류에 적용된 Hermes Agent의 메모리 시스템입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기