본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 22. 11:55

CHE MCP — 아르헨티나 최초의 국가적 MCP 생태계 구축: 5단계 분류기, WMA 온라인 학습, 748개 데이터셋

요약

아르헨티나의 실시간 데이터를 AI 에이전트와 연결하는 지능형 MCP 게이트웨이인 CHE MCP를 소개합니다. 5단계 분류 시스템과 WMA 온라인 학습 알고리즘을 통해 자연어 쿼리를 정확한 데이터 노드로 라우팅합니다.

핵심 포인트

  • 80개 이상의 공식 데이터 소스를 단일 MCP 서버로 통합 제공
  • WMA 알고리즘을 활용한 실시간 온라인 학습 기반의 지능형 라우팅
  • DuckDB와 NL-to-SQL을 결합하여 748개의 데이터셋을 자연어로 검색
  • MCPAgentBench 벤치마크에서 95.45%의 높은 정확도 달성

아르헨티나가 방금 최초의 국가적 MCP 생태계를 갖게 되었습니다. 그리고 이는 Bahía Blanca에서 구축되었습니다.

CHE MCP는 어떤 AI 에이전트라도 아르헨티나의 실시간 데이터와 연결해 주는 지능형 게이트웨이입니다. 달러 환율, 날씨, 축구, 세무 준수 (ARCA), 인플레이션, 대중교통 등 80개 이상의 공식 데이터 소스를 단 하나의 MCP 서버를 통해 제공합니다.

이것이 왜 중요할까요? 현재로서는 AI에게 "¿cuánto está el dólar blue?"(블루 달러 환율이 얼마인가요?)라고 묻고 싶다면, 직접 구글링을 하거나 80개의 서로 다른 MCP 서버를 설치해야 하기 때문입니다. CHE MCP는 스페인어 자연어를 이해하고 쿼리를 자동으로 라우팅하는 게이트웨이를 통해 이 문제를 해결합니다.

작동 방식 — 5단계 지능형 게이트웨이

쿼리: "dolar blue hoy"

┌────▼─────┐ 1단계 — 키워드 매칭 (Keyword matching)
│ 키워드 │ 182개 분류된 도메인에 걸친 3,000개 이상의 키워드
└────┬─────┘

┌────▼─────┐ 2단계 — WMA 가중치 라우팅 (WMA weighted routing)
│ WMA │ 가중 다수결 알고리즘 (Weighted Majority Algorithm): 모든 쿼리로부터 학습
└────┬─────┘

┌────▼─────┐ 3단계 — 시맨틱 임베딩 (Semantic embeddings)
│ 임베딩 │ Jaccard 폴백(fallback)을 포함한 384차원 벡터 (all-MiniLM-L6-v2)
└────┬─────┘

┌────▼─────┐ 4단계 — 데이터 노드 검색 (Data Node search)
│ 데이터 노드 │ 748개의 Parquet 데이터셋에 대한 DuckDB SQL + NL-to-SQL
└────┬─────┘

┌────▼─────┐ 5단계 — LLM 폴백 (LLM fallback)
│ LLM │ 외부 엔드포인트 (선택 사항, 설정 가능)
└────┬─────┘

┌────▼─────┐
│ 응답 │ "Dólar blue: $1,245 / $1,265 매수/매도"
└──────────┘

WMA 라우터 — 학습하는 분류기

가중 다수결 알고리즘 (Weighted Majority Algorithm, WMA)은 라우터에 직접 내장된 온라인 학습 (online learning) 시스템입니다. 모든 도메인은 동일한 가중치 (1.0)로 시작합니다. 쿼리가 성공하면 승리한 도메인에 강화 (+0.1)가 이루어집니다. 실패하면 해당 도메인에 페널티 (−0.1)가 부여됩니다. 가중치는 [0.1, 5.0] 범위로 제한되며 디스크에 저장됩니다. 즉, 라우터는 초기 상태(warm)로 시작하여 모든 쿼리와 함께 개선됩니다.

벤치마크: MCPAgentBench (66개의 다양한 쿼리)에서 95.45%의 Top-First-Score 정확도 달성

데이터 노드 — SQL, 하지만 자연스러운 방식

datos.gob.ar (아르헨티나 오픈 데이터 포털)로부터 가져온 748개의 Parquet 데이터셋을 Zstd를 사용하여 9.92배 압축했습니다 (CSV 3.92 GB 대비 404 MB). 데이터 노드 (Data Node)는 자연어를 SQL로 변환합니다:

사용자: "¿Cuánto aumentó la inflación en 2024?" (2024년 인플레이션이 얼마나 상승했나요?)
→ DuckDB 생성: SELECT AVG(valor) FROM indice_precios_consumidor WHERE fecha BETWEEN '2024-01-01' AND '2024-12-31'
→ 결과: 연간 117.8%

SQL 인젝션 (SQL injection) 방어 체계, 읽기 전용 (read-only) 강제 적용, 5초 타임아웃, 1,000행 결과 제한 기능이 포함되어 있습니다.

회복 탄력성 패턴 (Resilience Patterns)

패턴구현 방식
3단계 캐시 (3-tier cache)인메모리 (In-memory) LRU (200개 항목) → 디스크 (원자적 쓰기) → 라이브 CKAN
...

차세대 MCP 표준을 위해 구축됨

Model Context Protocol (MCP)은 2026년 7월에 가장 큰 아키텍처 업데이트를 앞두고 있습니다 — 필수적인 스트리밍 가능 HTTP 전송 (Streamable HTTP transport) 및 상태 비저장 아키텍처 (stateless architecture) 도입입니다. CHE MCP는 첫날부터 이를 위해 설계되었습니다:

  • ✅ 스트리밍 가능 HTTP 전송 (Streamable HTTP transport)
  • ✅ MCP SDK @modelcontextprotocol v1.29.0
  • ✅ 범위 검증 (scope validation) 기능이 포함된 JWT + API 키 인증
  • ✅ OpenTelemetry 분산 트레이싱 (distributed tracing)

기술 스택 (Tech Stack)

  • TypeScript 5.4 + Node.js 24
  • DuckDB (컬럼형, 임베디드 가능)
  • @xenova/transformers를 통한 all-MiniLM-L6-v2
  • Zod 검증, Vitest (280개 이상의 테스트)
  • MCP SDK v1.29.0 (server.registerTool API)

아르헨티나 바이아 블랑카 (Bahía Blanca)에서 Gentle AI의 SDD 오케스트레이션과 Engram 지속성 메모리(persistent memory)를 사용하여 구축되었습니다.

전체 기술 문서: github.com/Albano-schz/che-mcp-docs

국가적 규모의 MCP 생태계를 구축하는 것에 대해 어떤 궁금한 점이 있으신가요?

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0