본문으로 건너뛰기

© 2026 Molayo

HN요약2026. 05. 14. 19:14

Show HN: ArchGW – 에이전트를 위한 지능형 엣지 및 서비스 프록시

요약

Plano는 에이전트 기반 애플리케이션을 위한 AI 네이티브 프록시 서버 및 데이터 플레인입니다. 이 도구는 에이전트 라우팅, 오케스트레이션, 가드레일 필터링, LLM 라우팅 등 복잡하고 반복적인 인프라 작업을 중앙 집중화하여 개발자가 핵심 비즈니스 로직에만 집중할 수 있도록 돕습니다. Plano를 사용하면 앱 코드를 수정하지 않고도 에이전트 간의 저지연 오케스트레이션을 구현하거나, 모델 이름/별칭 기반으로 자동으로 LLM을 라우팅하는 등 프로덕션 환경에서 필요한 복잡한 기능을 쉽게 추가할 수 있습니다.

핵심 포인트

  • Plano는 에이전트 기반 앱 개발에 필수적인 인프라(라우팅, 오케스트레이션, 가드레일)를 중앙 집중화합니다.
  • 앱 코드를 수정하지 않고도 새로운 에이전트를 추가하거나 LLM을 자동으로 라우팅할 수 있습니다 (모델 민첩성).
  • OpenTelemetry를 통해 별도의 계측 코드 없이 모든 요청에 대한 엔드 투 엔드 추적(observability)을 제공합니다.
  • Envoy 기반으로 제작되었으며, 오케스트레이션, 모델 관리, 관측성을 모듈형 빌딩 블록으로 처리하여 유연성이 높습니다.

에이전트 기반 앱 (agentic apps)을 위한 AI 네이티브 프록시 서버 및 데이터 플레인 (data plane).

Plano는 반복적인 배관 작업 (plumbing work)을 제거하고 취약한 프레임워크 추상화 (framework abstractions)로부터 사용자를 분리하여, 모든 코드베이스에서 맞춤형으로 제작될 필요가 없는 요소들—예를 들어 에이전트 라우팅 (agent routing) 및 오케스트레이션 (orchestration), 지속적인 개선을 위한 풍부한 에이전트 신호 (agentic signals) 및 트레이스 (traces), 안전과 중재를 위한 가드레일 필터 (guardrail filters), 그리고 모델 민첩성을 위한 스마트 LLM 라우팅 API—를 중앙 집중화합니다. 어떤 언어나 AI 프레임워크든 사용하여 에이전트를 프로덕션 환경에 더 빠르게 배포하세요.

Quickstart Guide • Plano로 에이전트 기반 앱 구축하기 • Documentation • Contact

Plano가 유용하다고 생각되면 저장소에 Star ⭐️를 눌러주세요 — 새로운 릴리스와 업데이트가 이곳에 가장 먼저 올라옵니다.

에이전트 기반 데모를 만드는 것은 쉽습니다. 하지만 에이전트 기반 애플리케이션을 안전하고, 신뢰할 수 있으며, 반복 가능하게 프로덕션으로 출시하는 것은 어렵습니다. 빠른 해킹 (quick hack)의 스릴이 지나고 나면, 결국 프로덕션에 도달하기 위해 다음과 같은 "숨겨진 미들웨어 (hidden middleware)"를 구축하게 됩니다: 적절한 에이전트에 도달하기 위한 라우팅 로직 (routing logic), 안전과 중재를 위한 가드레일 훅 (guardrail hooks), 지속적인 학습을 위한 평가 및 관측성 (observability) 접착제, 그리고 프레임워크와 애플리케이션 코드 전반에 흩어져 있는 모델/제공자 (model/provider)의 특이 사항들입니다.

Plano는 핵심 전달 사항 (delivery concerns)을 통합된 프로세스 외 데이터 플레인 (out-of-process dataplane)으로 이동함으로써 이 문제를 해결합니다.

🚦 오케스트레이션 (Orchestration): 에이전트 간의 저지연 오케스트레이션; 앱 코드를 수정하지 않고도 새로운 에이전트 추가 가능.
🔗 모델 민첩성 (Model Agility): 모델 이름, 별칭 (semantic names) 또는 선호도에 따라 자동으로 라우팅.
🕵 Agentic Signals™: 모든 에이전트에 걸쳐 코드 작성 없이 신호 (Signals) 및 OTEL 트레이스/메트릭 (traces/metrics) 캡처.
🛡️ 중재 및 메모리 훅 (Moderation & Memory Hooks): 필터 체인 (Filter Chains)을 통해 탈옥 방지 (jailbreak protection)를 구축하고, 중재 정책 및 메모리를 일관되게 추가.

Plano는 프레임워크에서 반복적인 배관 작업을 추출하여 사용자가 가장 중요한 것, 즉 에이전트 기반 애플리케이션의 핵심 제품 로직에 집중할 수 있도록 합니다. Plano는 업계 선두의 LLM 연구를 기반으로 하며, 현대적인 워크로드 (workloads)를 위해 대규모 핵심 인프라를 구축했던 핵심 기여자들에 의해 Envoy를 기반으로 제작되었습니다.

High-Level Network Sequence Diagram:

저희 문서로 이동하여 Plano를 사용하여 에이전트 기반 애플리케이션 (agentic applications)의 속도, 안전성 및 관측성 (observability)을 어떻게 향상시킬 수 있는지 알아보세요.

중요 사항

Plano와 Plano LLM 제품군 (Plano-Orchestrator와 같은)은 Plano에 대한 훌륭한 첫 실행 개발자 경험을 제공하기 위해 US-central 리전에서 무료로 호스팅됩니다. 확장 및 프로덕션 (production) 환경에서 실행하려면, 이러한 LLM을 로컬에서 실행하거나 Discord를 통해 저희에게 연락하여 API 키를 받으실 수 있습니다.

Plano는 **오케스트레이션 (orchestration), 모델 관리 (model management), 및 관측성 (observability)**을 모듈형 빌딩 블록으로 처리하여, 기존 아키텍처에 깔끔하게 맞도록 필요한 기능만 구성할 수 있게 합니다 (에이전트 오케스트레이션 및 가드레일 (guardrails)을 위한 엣지 프록시 (edge proxying), 또는 서비스로부터의 LLM 라우팅 (routing), 또는 이 둘 모두).

아래는 세 가지 핵심 기능을 모두 보여주는 Plano로 구축된 간단한 멀티 에이전트 여행 에이전트입니다.

📁

전체 작동 코드: 로컬에서 실행할 수 있는 완전한 날씨 및 항공 에이전트는 demos/agent_orchestration/travel_agents/를 참조하세요.

# config.yaml
version: v0.3.0
# 선언 사항: 에이전트 URL 및 자연어 설명
...

여러분의 에이전트는 OpenAI 호환 채팅 완료 (chat completions) 엔드포인트를 구현하는 HTTP 서버일 뿐입니다. 어떤 언어나 프레임워크든 사용하세요:

# weather_agent.py
from fastapi import FastAPI, Request
from fastapi.responses import StreamingResponse
...

사전 요구 사항: Plano를 설치하고 환경을 설정하려면 사전 요구 사항 가이드를 따르세요.

# Plano 시작
planoai up config.yaml
...
...

모든 요청은 OpenTelemetry를 통해 엔드 투 엔드 (end-to-end)로 추적되며, 별도의 계측 (instrumentation) 코드가 필요하지 않습니다.

인프라 관련 사항Plano 미사용 시Plano 사용 시
에이전트 오케스트레이션 (Agent Orchestration)의도 분류기 (intent classifier) 및 라우팅 로직 작성YAML에 에이전트 설명 선언
모델 관리 (Model Management)각 제공업체의 API 특이사항 처리상태 관리 (state management) 기능이 포함된 통합 LLM API
풍부한 트레이싱 (Rich Tracing)모든 서비스에 OTEL 계측 (instrumentation) 적용자동화된 엔드 투 엔드 (end-to-end) 트레이스 및 로그
학습 신호 (Learning Signals)스팬 (spans) 캡처 및 내보내기를 위한 파이프라인 구축코드 수정이 필요 없는 (Zero-code) 에이전트 신호
에이전트 추가라우팅 코드 업데이트, 테스트, 재배포설정에 추가 후 재시작

효율적인 이유: Plano는 라우팅을 위해 무거운 프레임워크나 GPT-4 대신, 목적에 맞게 설계된 경량 LLM (예: 당사의 4B-parameter 오케스트레이터)을 사용합니다. 이를 통해 훨씬 적은 비용과 지연 시간 (latency)으로 프로덕션급 라우팅을 제공합니다.

저희와 연락하려면 Discord 서버에 참여해 주세요. 저희는 해당 채널을 적극적으로 모니터링하며 그곳에서 지원을 제공합니다.

Plano를 사용해 볼 준비가 되셨나요? 당사의 종합 문서를 확인해 보세요:

Quickstart Guide - 몇 분 안에 시작할 수 있습니다
LLM Routing - 모델 이름, 별칭(alias) 또는 지능형 선호도에 따라 라우팅합니다
Agent Orchestration - 멀티 에이전트 워크플로우를 구축합니다
Filter Chains - 가드레일 (guardrails), 모더레이션 (moderation) 및 메모리 훅 (memory hooks)을 추가합니다
Prompt Targets - 프롬프트를 결정론적 (deterministic) API 호출로 변환합니다
Observability - 트레이스 (traces), 메트릭 (metrics) 및 로그 (logs)

저희의 로드맵 (Roadmap)에 대한 피드백을 환영하며, Plano에 대한 기여도 언제나 환영합니다! 버그 수정, 새로운 기능 추가, 문서 개선 또는 튜토리얼 제작 등 여러분의 도움은 매우 소중합니다. 자세한 내용은 기여 가이드 (Contribution Guide)를 방문해 주세요.

Plano가 유용하다고 생각하신다면 저장소에 별 (Star ⭐️)을 눌러주세요 — 새로운 릴리스와 업데이트가 이곳에 가장 먼저 올라옵니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 HN Show HN (AI)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0