Kilo CLI 실전 — roll-call로 500개 이상의 모델을 병렬 헬스 체크하기 - Insights | Molayo

코딩 에이전트 OSS CLI는 Aider, OpenCode, Pi, Goose…… 등 지난 몇 달 사이 선택지가 급증했습니다. 여기에 새롭게 추가된 것이 Kilo(Kilo-Org/kilocode)입니다. GitHub Star 수는 본 기사 작성 시점(2026년 7월 1일) 기준 25,242개, npm 패키지 @kilocode/cli의 주간 다운로드 수는 52,191회(2026-06-22~06-28 집계)로, 이미 실운영에서 사용되고 있는 규모입니다12.

VS Code 확장, JetBrains 확장, CLI, 클라우드의 4개 측면을 하나의 엔진으로 구동하는 '올인원 에이전틱 플랫폼 (All-in-one Agentic Platform)'을 표방하며, 500개 이상의 모델에 BYOK (Bring Your Own Key) 방식으로 마크업 없이 제로(zero) 마크업 연결이 가능하다는 것이 특징입니다.

본 기사에서는 실제로 @kilocode/cli를 설치하고, 도움말(help) 출력으로부터 실재하는 서브 커맨드(subcommand)를 확인하면서, 특히 편리하다고 느낀 kilo roll-call (복수 모델의 병렬 통신 테스트)과 공식 문서를 읽으며 알게 된 Orchestrator 모드 폐지 경위를 깊이 있게 다룹니다.

@kilocode/cli의 실제 설치 절차와 서브 커맨드 전체 모습
kilo roll-call로 복수 프로바이더(provider)의 모델을 병렬 헬스 체크(health check)하는 방법
Kilo가 'Orchestrator 모드'를 폐지하고 각 모드에 서브 에이전트(sub-agent)를 네이티브로 통합한 이유
Aider, OpenCode 등 기존 OSS 코딩 에이전트와의 포지셔닝 차이
여러 LLM 프로바이더를 전환하며 사용 중인 엔지니어
OSS 코딩 에이전트의 선정 기준을 찾고 있는 분
MCP 서버를 CLI에서 직접 관리하고 싶은 분
OS: Linux (macOS / Windows에서도 동일한 절차)
Node.js: v22.x
@kilocode/cli v7.3.54 (2026년 7월 1일 기준 최신)
npm install -g @kilocode/cli로 kilo / kilocode 두 개의 바이너리가 설치됨 (MIT 라이선스)
kilo roll-call <filter>는 정규 표현식으로 모델을 필터링하며, --parallel, --timeout, --output table|json|md를 통해 복수 모델의 통신 및 레이턴시(latency)를 일괄 테스트할 수 있음
공식 문서에는 'Orchestrator agent는 권장되지 않음(deprecated)'이라고 명시되어 있으며, 그 이유는 Code / Plan / Debug 각 모드가 서브 에이전트를 네이티브로 지원하기 때문
반면 마케팅 사이트에는 여전히 'Use Orchestrator Mode'라는 문구가 남아 있어, 문서와의 온도 차가 존재함

@kilocode/cli는 npm 배포 외에도 Homebrew, curl, pnpm, bun, AUR을 지원합니다. 이번에는 npm으로 설치했습니다.

npm install -g @kilocode/cli
# added 5 packages in 15s

package.json을 보면 kilo와 kilocode라는 두 개의 바이너리가 동일한 실체에 링크되어 있으며, opencode나 ink (터미널 UI용 React 렌더러)가 keywords에 포함되어 있습니다. TUI 프레임워크로서 Ink 기반으로 만들어졌다는 점은 Claude Code나 OpenCode 등 최근의 CLI 코딩 에이전트에서 공통적으로 나타나는 설계입니다.

kilo --version
# 7.3.54

kilo --help를 실행하면 27개의 서브 커맨드가 표시됩니다 (completion, upgrade, session, plugin, config 등 설정 및 유지보수 계열 제외). 단순한 '채팅하고 편집하는' 에이전트에 머물지 않는 기능군 중에서 특히 눈에 띄는 것들을 발췌합니다.

kilo [project] start kilo tui [default]
kilo run [message..] run kilo with a message
kilo attach <url> attach to a running kilo server
...

kilo serve 또는 kilo web을 통해 헤드리스 서버 (headless server)로 만들어 브라우저에서 조작하거나, kilo remote를 통해 실시간 세션을 외부로 중계할 수 있다는 점은 터미널 전용 도구에는 없는 발상입니다. kilo pr <number>는 GitHub PR의 브랜치를 fetch & checkout하여 그대로 에이전트를 실행하는 단축키로, 리뷰 요청에 즉각 대응할 때 유용해 보입니다.

개인적으로 가장 실용적이라고 느낀 것은 kilo roll-call입니다. 여러 프로바이더 (provider)에 걸쳐 계약된 다수의 모델이 "지금 작동하는지", "얼마나 빠른지"를 일괄적으로 확인할 수 있습니다.

kilo roll-call --help

kilo roll-call <filter>
batch-test text models matching a filter for connectivity and latency
Positionals:
...

filter는 provider/modelID에 대한 정규 표현식이며, 예를 들어 다음과 같이 실행합니다 (API 키가 등록된 프로바이더가 대상).

# anthropic 산하의 모델만을 대상으로, 5개 병렬(parallel)로 헬스 체크
kilo roll-call "anthropic/.*" --parallel 5 --output table
# 결과를 JSON으로 받아 CI의 헬스 체크에 통합
...

--output json을 사용하면, 계약 중인 모든 모델의 통신 확인을 CI 파이프라인에 포함시켜 "오늘 사용할 수 있는 모델 목록"을 매일 아침 생성하는 등의 운영도 현실적입니다. 본 세션에서는 API 키가 등록되지 않아 실측값은 게시하지 않지만, 명령어 자체는 위와 같이 kilo에 포함되어 있으며, --parallel, --timeout, --output 세 가지 옵션만으로 기존의 헬스 체크 스크립트를 대체할 수 있는 설계라는 점은 실행 결과(--help)를 통해 확인했습니다.

Kilo 소개 기사들을 읽어보면 "Architect / Code / Debug / Ask / Orchestrator의 5가지 모드"라는 설명을 볼 수 있습니다. 하지만 공식 문서의 해당 페이지(kilo.ai/docs/code-with-ai/agents/orchestrator-mode, 제목은 "Orchestrator Mode (Deprecated)")를 확인해보니 상황이 달랐습니다.

Orchestrator mode is deprecated and will be removed in a future release. [...] Agents with full tool access (Code, Plan, Debug) can now delegate to subagents automatically. You no longer need a dedicated orchestrator...

즉, "복잡한 태스크를 전문 에이전트에게 위임하는 사령탑"이었던 Orchestrator 모드는 폐지되었으며, 대신 Code, Plan, Debug의 각 모드가 직접 서브 에이전트 (subagent)를 호출할 수 있도록 통합되었습니다. 문서상의 현재 모드는 다음 4가지입니다.

모드	권한	역할
Code (기본값)	풀 액세스 (Full access)	구현 및 디버깅을 수행하는 "숙련된 엔지니어"
...	...	...

여기서 흥미로운 점은, 문서상에서는 Orchestrator가 명확하게 비권장 (deprecated)이라고 적혀 있는 반면, 공식 마케팅 사이트(kilo.ai/code

）에는 여전히 "Use Orchestrator Mode and Code Review to plan, build, and audit simultaneously."라는 소구 문구가 남아 있다는 점입니다. 제품의 내부 설계(서브 에이전트(Sub-agent)를 Code/Plan/Debug로 통합)가 마케팅 문구의 업데이트보다 먼저 진행되어 버린—여러 문서 소스를 대조해 보아야 비로소 알아차릴 수 있는 종류의 정보로, 단일 페이지의 소개 기사에서는 놓치기 쉬운 포인트라고 느꼈습니다.

이 "전담 오케스트레이터(Orchestrator) 역할을 폐지하고, 각 에이전트에게 서브 에이전트 기능을 갖게 한다"는 설계의 변화는, Claude Code가 단일 Task 도구에서 여러 서브 에이전트 유형 및 중첩된(nested) 서브 에이전트로 확장해 온 흐름과도 맞닿아 있습니다. 멀티 에이전트(Multi-agent) 설계가 "전담 사령탑을 세우는" 방향에서 "주요 에이전트에게 위임 능력을 갖게 하는" 방향으로 시프트(shift)하고 있다는 업계적 조류의 한 사례로 보면 흥미롭습니다.

MCP 서버의 추가 및 인증도 CLI에서 완결됩니다.

kilo mcp --help

kilo mcp add add an MCP server
kilo mcp list list MCP servers and their status
kilo mcp auth [name] authenticate with an OAuth-enabled MCP server
...

kilo mcp auth / kilo mcp debug가 서브 커맨드(subcommand)로 독립되어 있다는 점은 은근히 편리합니다. OAuth 연결이 잘 되지 않는 MCP 서버의 디버깅은 많은 에이전트 CLI에서 --verbose 로그를 grep으로 찾아보는 수밖에 없지만, Kilo는 전용 명령어를 준비해 두었습니다.

이 블로그에서는 지금까지 Aider(architect / editor 모드로 모델을 역할 분담), OpenCode(Ollama로 로컬 완결), Pi(1,000 토큰 미만의 시스템 프롬프트로 동작하는 경량 하네스(Harness))를 다루어 왔습니다. Kilo는 이들과 비교했을 때 "하나의 바이너리(binary)로 IDE 확장, CLI, 헤드리스(headless) 서버, 원격 중계까지 책임진다"는 통합 지향성이 강한 것이 특징입니다.

도구	주요 강점	CLI 이외의 측면
Aider	architect/editor로 모델을 역할 분담	없음 (CLI 전용)
OpenCode	로컬 LLM (Ollama)와의 셀프 호스팅 완결	TUI
Kilo	roll-call을 통한 여러 모델 일괄 헬스 체크, `kilo web` / `kilo remote`	VS Code / JetBrains 확장, 헤드리스 서버

여러 프로바이더(provider)의 API 키를 병용하며 "어느 모델이 오늘은 느린지·다운되었는지"를 빠르게 파악하고 싶을 때나, IDE 확장과 CLI를 동일한 엔진으로 오가고 싶을 때는 Kilo가 후보가 될 수 있을 것 같습니다.

@kilocode/cli (MIT · 25,242 stars · 주간 DL 52,191)는 npm install -g @kilocode/cli로 즉시 도입 가능
kilo roll-call은 정규 표현식 필터 × 병렬 실행으로 여러 모델의 통신 상태 및 레이턴시(latency)를 일괄 확인 가능한, 소박하지만 실무적으로 유용한 명령어
Orchestrator 모드는 문서상 "비권장(deprecated)" 상태. Code/Plan/Debug로의 서브 에이전트 네이티브 통합이라는 설계 변경의 결과이며, 마케팅 문구와는 아직 차이가 있음
여러 프로바이더를 병용하고 있다면 roll-call만이라도 시도해 볼 가치가 있음
Kilo-Org/kilocode - GitHub (GitHub API 취득, 2026-07-01 시점 stargazers_count: 25242) ↩
@kilocode/cli - npm (npm downloads API 취득, 2026-06-22~06-28 주간 DL: 52191) ↩

Insights

Kilo CLI 실전 — roll-call로 500개 이상의 모델을 병렬 헬스 체크하기

요약

핵심 포인트

댓글

Spring AI 튜토리얼 — OpenAI를 활용한 첫 번째 REST 엔드포인트 구축 (2026)

Spring AI + MCP Bridge 튜토리얼 — ChatClient에 외부 도구 서버 연결하기 (2026)

AI와 일자리에 관한 가장 안심할 만한 논거: 왜 Z세대가 취업에 어려움을 겪는지에 대한 설명

Geely, 중국 무역 협정에 따라 캐나다로 Lotus 전기차(EV) 수출 예정 – 보도

Spring AI 튜토리얼 — OpenAI를 활용한 첫 번째 REST 엔드포인트 구축 (2026)

Spring AI + MCP Bridge 튜토리얼 — ChatClient에 외부 도구 서버 연결하기 (2026)

AI와 일자리에 관한 가장 안심할 만한 논거: 왜 Z세대가 취업에 어려움을 겪는지에 대한 설명

Geely, 중국 무역 협정에 따라 캐나다로 Lotus 전기차(EV) 수출 예정 – 보도