StartupHakk/OpenMonoAgent.ai
요약
OpenMono는 사용자의 로컬 하드웨어에서 실행되는 오픈 소스 코딩 에이전트입니다. .NET 기반으로 구축되어 데이터 프라이버시를 보장하며, 클라우드 비용 없이 Docker 샌드박싱과 20개의 내장 도구를 활용한 완전한 에이전트 루프를 제공합니다.
핵심 포인트
- 로컬 우선 설계로 데이터 유출 방지 및 비용 제로 실현
- .NET 기반 및 llama.cpp를 통한 GPU/CPU 자동 구성
- Docker 샌드박싱과 LSP, MCP 통합을 통한 강력한 코드 지능
- TUI 및 CLI 모드를 지원하는 사용자 친화적 인터페이스
오픈 소스 코딩 에이전트 (Open-source coding agent). 로컬 우선 (Local-first). 비용 제로 (Zero cost). 클라우드 제로 (Zero cloud).
AI의 민주화를 위해 구축되었습니다. .NET 기반으로 구동됩니다.
OpenMono는 완전히 사용자의 하드웨어에서 실행되는 코딩 에이전트입니다. 구독료가 없으며, 데이터가 네트워크를 벗어나지 않고, 토큰당 과금이 발생하지 않습니다. .NET 10 CLI와 자체 llama.cpp 추론 서버 (inference server)를 결합하여, 20개의 내장 도구, Docker 샌드박싱 (sandboxing), 심층적인 코드 지능 (code intelligence)을 갖춘 완전한 에이전트 루프 (agentic loop)를 제공합니다. GPU 또는 CPU 환경 모두에서 자동으로 구성됩니다. 모델, 컴퓨팅 자원, 그리고 데이터를 사용자가 직접 소유합니다.
bash <(curl -fsSL https://raw.githubusercontent.com/StartupHakk/OpenMonoAgent.ai/refs/heads/main/get-openmono.sh)
그 후 어떤 프로젝트에서든 다음과 같이 실행합니다:
cd your-project/
openmono agent # TUI 모드 (기본값)
openmono agent --classic # 클래식 스크롤링 터미널
참고
대화형 터미널에서는 TUI 모드가 기본입니다. CLI용으로는 openmono agent --classic을 사용하세요.
→ 전체 명령어 참조 — 일일 명령어, 설정 플래그 (setup flags), GPU/CPU 옵션
대부분의 코딩 에이전트는 오픈 소스라는 라벨을 붙인 클라우드 제품입니다. 사용자의 프롬프트 (prompts), 코드, 그리고 컨텍스트 (context)는 키를 입력할 때마다 타인의 서버로 전송됩니다. 사용자는 한도 없이 영원히 토큰당 비용을 지불해야 합니다.
OpenMono는 llama.cpp를 통해 사용자의 하드웨어에서 모델을 실행합니다. RTX 3090이나 워크스테이션 NUC 정도만 있으면 충분합니다. 한 번의 설정 이후에는 추론 (inference) 비용이 전혀 들지 않습니다. 코드는 절대 기기를 떠나지 않습니다. 계정, 사용량 대시보드, API 키도 필요 없습니다.
이는 완전한 에이전트 루프 (agentic loop)입니다: 20개의 도구, 하위 에이전트 (sub-agents), Docker 샌드박싱 (sandboxing), LSP 코드 지능 (code intelligence), 네이티브 Roslyn C# 분석, MCP 통합, 그리고 플레이북 (playbooks)을 포함합니다. GPU에서는 약 45 tok/s, CPU에서는 약 20 tok/s의 속도로 실행됩니다.
| OpenMono | Claude Code | OpenCode | |
|---|---|---|---|
| 추론 비용 (Inference cost) | 토큰당 0원 (로컬) | 토큰당 과금 | 토큰당 과금 |
| 데이터 프라이버시 (Data privacy) | 완전 오프라인 가능 | 클라우드 전용 | 제공업체에 따라 다름 |
| 기본 추론 (Default inference) | llama.cpp 포함, 설정 불필요 | Anthropic API 필요 | 직접 제공업체 선택, 포함된 추론 엔진 없음 |
| 샌드박싱 (Sandboxing) | Docker 네이티브 | 호스트 프로세스 | 호스트 프로세스 |
| 코드 지능 (Code intelligence) | LSP + Roslyn + MCP 그래프 도구 | 파일 읽기 | LSP (30개 이상의 서버) |
| 확장성 (Extensibility) | 플레이북 (Playbooks, 타입 지정 및 조합 가능) | 스킬 (Skills, 마크다운) | 플러그인 (Plugins, TS SDK) |
| MCP | 클라이언트 (stdio) | 전체 클라이언트 | 전체 클라이언트 |
| UI | TUI + CLI | 웹, 데스크톱, VS Code, CLI | TUI, 데스크톱, 웹 |
| | | | |
| | | | |
| | | | |
| | | | |
| 설치되어 있는 경우, 설정 없이도 graphify (시맨틱 개념 그래프, 25개 이상의 언어) 및 code-review-graph (MCP를 통한 구조적 호출 그래프, 약 22개의 도구)를 자동 감지합니다. |
| | | | |
| | | | |
09 · 분산 추론 (Distributed inference) — 노트북에서 에이전트를 실행하고, 추론은 별도의 GPU 머신에서 수행합니다. app.openmonoagent.ai에서 무료 릴레이(relay)를 이용할 수 있습니다.
→ 듀얼 박스 설정 가이드 — 터널 설정, 릴레이 연결, 문제 해결
| VRAM / RAM | 모델 (Model) | 정확도 (Accuracy) | 속도 (Speed) |
|---|---|---|---|
| GPU 24 GB+ | Qwen3.6-27B-Q4_K_M | 전체 (Full) | ~45–70 tok/s |
| ... |
참고
설치 프로그램이 하드웨어를 감지하여 적절한 모델을 자동으로 선택하므로 별도의 설정이 필요하지 않습니다. 12 GB 및 16 GB GPU 카드가 지원되지만, 정확도가 낮은 모델로 실행됩니다. 최상의 결과를 위해 24 GB 카드를 사용하십시오. Ubuntu 26.04 LTS (권장) 또는 25.10이 필요합니다.
HTTP를 통해 로컬 llama.cpp 추론 서버를 구동하는 .NET 10 CLI이며, 모든 기능은 Docker 내에서 샌드박스화되어 실행됩니다. 에이전트는 토큰을 스트리밍하고, 12단계 파이프라인을 통해 도구 호출 (tool calls)을 전달하며, 작업이 완료될 때까지 루프를 반복합니다.
설정은 ~/.openmono/settings.json (사용자 수준) 또는 .openmono/settings.json (프로젝트 수준)에서 로드됩니다. — 참조, 제공업체, 권한, MCP 서버 포함
/think, /undo, /resume, /export를 포함한 14개의 슬래시 명령어 (slash commands)가 제공됩니다. TUI 모드를 위한 전체 키보드 단축키 참조를 확인하세요.
- 로드맵 (Roadmap)
- 설정 및 명령어 (Setup & commands) — 일일 명령어 (daily commands), TUI vs 클래식 (classic), 플래그 (flags)
- 아키텍처 (Architecture) — .NET CLI + llama.cpp + Docker, 전체 다이어그램 (full diagram)
- 모델 및 추론 모드 (Models & reasoning mode)
- 설정 (Configuration) — settings.json, 프로바이더 (providers), 권한 (permissions), MCP 서버 (MCP servers)
- 도구 (Tools)
- 플레이북 (Playbooks)
- graphify — 시맨틱 코드 그래프 (semantic code graph), 25개 이상의 언어 지원
- code-review-graph — MCP를 통한 구조적 호출 그래프 (structural call graph)
- 기여하기 (Contributing)
참고 (Note)
OpenMono는 퍼블릭 베타 (Public Beta) 단계입니다. 얼리 액세스 (Early access)가 열려 있으며, 빠르게 업데이트를 배포하고 있습니다. 직접 사용해 보시고 다음에 보고 싶은 기능이 있다면 알려주세요.
OpenMono는 초기 단계이며 빠르게 발전하고 있습니다. 새로운 도구, 프로바이더 (providers), LSP 서버, 플레이북 (playbooks), 버그 수정 또는 문서 작성 등 모든 기여를 환영합니다.
PR (Pull Request)을 생성하기 전에 기여 가이드 (contributing guide)를 읽어주세요.
"AI는 빌려 쓰는 구독 서비스가 되어서는 안 됩니다. 그것은 당신이 소유하는 인프라가 되어야 합니다 —
당신의 책상 위에 놓여, 당신의 코드를 서빙하며, 오직 당신에게만 응답하는 인프라 말입니다."
— Startup Hakk
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub AI Coding Assistants의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기