본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 23. 20:06

2026년 중반의 코딩 CLI: 엔지니어를 위한 지도 (그리고 30일 동안 변한 것들)

요약

2026년 중반 AI 코딩 CLI 시장의 변화를 분석하며, 도구 선택의 기준이 프로토콜에서 모델과 가격으로 이동했음을 설명합니다. 터미널 기반 엔지니어를 위한 도구 분류 체계와 최근 서비스 종료 및 리브랜딩 사례를 업데이트하여 제공합니다.

핵심 포인트

  • CLI 도구 선택의 핵심 기준은 프로토콜이 아닌 모델과 가격임
  • 대부분의 CLI는 오픈 소스이지만 API 토큰 비용이 발생함
  • Phind, Gemini CLI 등 주요 도구들의 서비스 종료 및 변화 사례 업데이트
  • 사용자 환경(Surface Affordance)에 따른 4분법 분류 체계 제시

5월에 작성된 글(2026년 모든 AI 코딩 CLI: 완전한 지도, 30개 도구 비교)은 가격과 개방성을 기준으로 도구들을 분류했습니다. 그것은 하나의 축입니다. 하지만 사용자가 터미널을 열고 무언가를 선택해야 할 때 실제로 신경 쓰는 축은 아닙니다. 중요한 축은 **표면적 어포던스 (surface affordance)**입니다. 즉, 내가 어떤 형태의 작업을 하려고 하는가, 그리고 어떤 형태의 도구가 그 형태에 부합하는가 하는 점입니다.

이번 후속 글은 그 질문을 중심으로 재구성하였으며, 터미널을 사용하는 엔지니어로 범위를 좁혔고, 30일 동안 변화한 모든 내용을 업데이트했습니다. (비기술적 빌더를 위한) Desktop / Cloud Web / Cloud Agent 관련 글은 동반 기사(companion article)입니다.

목록을 살펴보기 전 두 가지 프레임워크 관찰 결과가 있습니다.

첫째: 전쟁은 끝났고 와이어 포맷 (wire format)은 정착되었습니다. 2026년 중반의 모든 진지한 CLI 하네스 (harness)는 최소한 OpenAI 호환 또는 Anthropic-Messages 엔드포인트 중 하나를 수용합니다. "어떤 프로토콜을 사용하는가"라는 질문은 더 이상 중요하지 않습니다. 이제는 "어떤 제공자(provider)를, 어떤 모델을, 어떤 가격에 사용하는가"가 핵심적인 질문입니다.

둘째: "무료"는 거의 항상 무료 소프트웨어에 유료 토큰이 결합된 형태를 의미합니다. CLI 자체는 오픈 소스이며 무료이지만, 그것이 소비하는 API 토큰은 무료가 아닙니다. 여전히 실제 모델을 사용하는 진정한 의미의 무료 제공 서비스가 소수 존재하지만, 무게 중심은 이동했습니다.

깔끔한 4분법 분류 (four-way taxonomy)

두 편의 글을 통해 이 분야를 탐구한 결과, 가장 깔끔한 구분은 네 가지 카테고리입니다. 상호 배타적이며 전체를 포괄하며, 중복 논란이 없는 분류입니다:

카테고리작업 환경예시
CLI터미널Claude Code, Codex CLI, Aider, OpenCode
...

이 기사는 첫 번째 열에 관한 것입니다. 나머지는 동반 기사에 담겨 있습니다.

몇몇 도구들은 두 가지 환경에 걸쳐 있습니다. 이 경우, 주요 사용자 환경 (primary user surface)(사용자가 실제로 머무는 곳)을 기준으로 배치하고, 보조 환경은 별개의 제품이 아닌 아키텍처적 특성으로 명시합니다.

30일 동안 변한 것들

AI 코딩 도구 환경은 매우 빠르게 변화하기 때문에, 한 달만 지난 지도라도 변화량(delta) 페이지가 필요합니다.

은퇴(Retired), 서비스 종료(sunsetted), 또는 EOL(End of Life) 모드.

  • Phind는 "파운데이션 모델 (foundation-model) 제공업체들에 의한 범용화 (commoditisation)"를 이유로 2026년 1월 16일에 서비스를 종료했습니다. 이 가설을 보여주는 가장 깔끔한 단일 사례입니다.
  • Gemini CLI는 2026년 6월 18일에 유료 인증 (paid auth) 서비스를 종료합니다. Antigravity CLI (I/O에서 5월 19일부터 GA)로 대체됩니다.
  • Roo Code는 4월 21일에 종료를 발표했으며, 5월에 아카이브되었습니다. 사용자들은 Kilo Code로 마이그레이션합니다.
  • Cascade (Windsurf의 에이전트)는 2026년 7월 1일에 서비스 종료 (end-of-life)됩니다.
  • iFlow CLI의 서비스 종료 (sunset)가 2026년 4월 17일에 발표되었습니다. 추천하기 전에 반드시 확인하십시오.
  • Amazon Q Developer: 2026년 5월 15일부터 신규 가입이 차단되었습니다. 기존 시트(seats)만 유지됩니다. 사실상 EOL 상태입니다.

리브랜딩 (Rebranded).

  • Windsurf는 Cognition의 2억 5천만 달러 인수 이후, 이제 Devin Desktop (2026년 6월 2일)이 되었습니다.
  • Mistral의 Le Chat은 이제 Vibe (2026년 5월 28일)입니다. Vibe CLI는 1월에 2.0 버전을 출시했습니다.
  • Goose는 2026년 4월에 Block에서 Linux Foundation Agentic AI Foundation으로 이동했습니다. 새로운 리포지토리는 aaif-goose/goose에 있습니다. 단순히 코드 수준의 중립성이 아닌, 재단이 관리하는 벤더 중립성 (vendor neutrality)을 지향합니다.

주목할 만한 가격 변동 (Pricing churn).

  • Qwen Code의 무료 OAuth는 2026년 4월 15일에 폐지되었습니다. 현재 가장 저렴한 경로: Ollama에서 실행하는 로컬 Qwen3-Coder (~4-bit 기준 약 46GB), OpenRouter의 qwen/qwen3-coder:free 속도 제한 계층 (1회 10달러 결제 시 일일 1k 요청 가능), 또는 Alibaba의 월 $50 ModelStudio 코딩 플랜 (월 약 90k 요청 가능)입니다. CLI는 여전히 Apache-2.0 라이선스이지만, 더 이상 Alibaba를 상대로 무료로 실행할 수는 없습니다.
  • Devin의 기업 전용 월 $500 하한선이 2026년 4월에 붕괴되었습니다. 이제 월 $20 + ACU당 $2.25로 책정됩니다. 클라우드 에이전트 분야에서 올해 가장 큰 가격 변동 사건입니다 (관련 별도 기사에서 다룸).
  • GitHub Copilot은 2026년 6월 1일에 사용량 기반 AI 크레딧 (usage-based AI Credits) 방식으로 전환되었습니다. 무료 CLI는 이제 토큰 측정 (token-metered) 방식입니다.
  • **DeepSeek V3 / R1은 2026년 7월 24일에 지원 종료 (deprecate)**되며, V4 (Pro + Flash, 2026년 4월 출시)로 대체됩니다. 기존 기사에서 V3 가격을 언급한 내용은 모두 이미 구식이 되었습니다.

만약 한 달 전의 지도를 보고 작업 중이라면, 이것이 당신을 위한 패치입니다.

2026년 중반의 CLI: 무료 vs 유료

제가 티어(tier)별로 나누는 이유는 터미널 환경에서 여러분이 주로 신경 쓰는 것이 두 가지이기 때문입니다: 비용이 얼마나 드는지, 그리고 본인의 모델을 직접 연결할 수 있는지 여부입니다. 각 항목에 대해 저는 제3자 API 지원 여부와 로컬 추론(local-inference) 경로(Ollama, LM Studio, llama.cpp, vLLM)를 함께 기재하고 있습니다. 2026년 중반인 현재, 이 조합이야말로 유연한 하네스(harness)를 정의하는 핵심 요소이기 때문입니다.

무료 CLI, BYO 토큰 또는 로컬 추론 (local inference)

이들은 오픈 소스(open-source)이거나 무료 티어(free-tier)를 제공하는 CLI입니다. 도구 자체는 무료이지만, 그 뒤에 있는 모델에 대한 비용을 지불하게 됩니다. 이들은 모두 OpenAI 호환 엔드포인트(endpoints)를 수용하며, 대부분 Anthropic-Messages도 수용합니다. 이는 해당 두 프로토콜 중 하나를 사용하는 모든 제공업체(DeepSeek, OpenRouter를 통한 Qwen, GLM/Z.AI, Kimi, Mistral, 그리고 모든 로컬 Ollama / LM Studio / vLLM 엔드포인트 포함)로 라우팅할 수 있음을 의미합니다.

도구 (Tool)정체 (What it is)모델 특화 경향 (Model-specific tilt)비고 (Note)
AiderApache-2.0, git 네이티브 페어 프로그래밍. Repomap + 자동 커밋(auto-commit).없음 (내부적으로 LiteLLM 사용)성숙함, 약 39k stars
...

"모델 특화 경향 (model-specific tilt)"이 무엇을 의미하는지에 대한 참고 사항: Qwen Code, Kimi Code CLI, Mistral Vibe, Antigravity와 같은 하네스들은 특정 모델 제품군을 중심으로 _목적에 맞게 제작(purpose-built)_되었으며, 제공업체 설정과 프롬프트 포맷팅(prompt formatting)이 해당 제품군에 맞춰 튜닝되어 있습니다. 이들은 OpenAI 호환 엔드포인트를 통해 다른 모델도 실행할 수 있지만, 기본 레지스트리(registry)와 가장 잘 테스트된 경로는 해당 도구가 제공하는 모델 제품군입니다. 모델 불가지론적(model-agnostic)인 도구들(Aider, Goose, OpenCode, Crush, Hermes, OpenClaw, sgpt)은 첫날부터 제공업체를 상호 교환 가능한 것으로 취급합니다.

모델 수준에서 진정으로 무료인 것(단순히 CLI 수준이 아닌)에 대한 참고 사항: ChatGPT 무료 티어의 Codex CLI, Google의 무료 Gemini 티어의 Antigravity CLI, GitHub Copilot 무료 플랜(제한된 크레딧), Sourcegraph의 Amp(광고 지원 모델이 테스트 중인 동안 무료), OpenRouter의 무료 Qwen3-Coder 경로(속도 제한 있음). 그 외의 모든 것은 BYOK(Bring Your Own Key) 방식이며, 토큰에 대한 비용을 직접 지불해야 합니다.

먼저 퍼스트 파티(first-party) 제품이 부재한 부분에 대한 참고 사항입니다: DeepSeek는 퍼스트 파티 CLI가 없습니다 (Deep Code와 DeepSeek-TUI는 커뮤니티 제품입니다). Zhipu/GLM은 자체 CLI 대신 Claude Code / Cline / Goose / OpenCode / Crush / Kilo에 출시 첫날부터 통합되는 방식을 택했습니다. Meta는 Llama 네이티브 CLI가 없으며, Hermes Agent가 사실상의 Llama-4 호스트 역할을 합니다. gpt-oss는 Codex CLI의 --oss 모드와 Ollama를 통한 모든 BYOK(Bring Your Own Key) 하네스(harness) 내에 존재합니다.

유료 구독형 CLI

이 도구들은 의미 있게 사용하려면 활성화된 구독이 필요합니다. 일상적인 업무용으로 사용할 수 있는 실질적인 무료 티어는 없습니다.

도구가격 정책제공업체 매트릭스 (Provider matrix)로컬 (Local)기울기 (Tilt)
Claude Code (Anthropic)Claude 유료 플랜에 포함되거나, Anthropic API 요율에 따른 BYOK 방식. 무료 CLI 사용 불가.관리형 서비스에서는 Anthropic-Messages만 지원; subagent/extension 레이어가 해결책임퍼스트 파티 로컬 지원 없음강력하게 Claude에 편향
...

라우터(Routers) 및 프록시(proxies)

위에서 언급한 대부분의 무료 티어 CLI들을 단일 통합 제공업체로서 이들 중 하나로 지정할 수 있기 때문에 알아둘 가치가 있습니다.

  • OpenRouter — 단일 API 인터페이스를 가진 멀티 제공업체 애그리게이터(aggregator). 토큰당 유료. 일부 모델(Qwen3-Coder, Hermes 3 405B)에 대해 무료 경로 제공.
  • Together AI / Fireworks / DeepInfra / Groq — 중국 및 Meta의 오픈 웨이트(open weights) 모델을 서비스하는 미국 관할권 호스트. 데이터 거주성(data-residency)의 트레이드오프 없이 성능을 원할 때 유용함.
  • Kilo Gateway — 0% 마진으로 500개 이상의 모델 제공. OpenClaw 및 Kilo CLI와 깔끔하게 결합됨.
  • 9router, CLIProxyAPI — 자신의 청구서와 속도 제한(rate limits)을 직접 관리하고 싶을 때 사용하는 OSS(오픈 소스 소프트웨어) 셀프 호스팅 라우터.

도구의 한계점 (Where does the tool stop)

추적할 가치가 있는 두 번째 축은 단순히 어떤 도구인가가 아니라, 그 도구가 어디에서 멈추는가입니다:

제안(suggest) → 편집(edit) → 커밋(commit) → PR → 배포(deploy) → 라이브 앱(live app)

도구의 선택은 부분적으로 자동화가 어디까지 종료되기를 원하는지에 관한 것입니다. Aider는 편집(edit) 단계에서 멈춥니다. Claude Code는 PR 단계에서 멈춥니다. Codex CLI는 PR 단계(샌드박스 환경)에서 멈춥니다. Devin은 배포(deploy) 단계에서 멈춥니다. Bolt는 라이브 앱(live app) 단계에서 멈춥니다.

단순히 기능(capability)에 의해서가 아니라, 어느 시점에서 인간에게 작업 전환(handoff)을 넘길 것인지에 따라 선택하십시오.

오픈 웨이트 (Open-weights) 클라우드 API 가격 (2026년 6월 스냅샷)

OSS CLI를 클라우드 모델로 연결하여 사용 중이라면, 현재의 지형은 다음과 같습니다. 모든 가격은 100만 토큰당 USD 기준입니다. 2026년 6월 21일 기준 공식 제공업체 페이지를 통해 검증되었습니다.

모델제공업체입력 (In)출력 (Out)캐시된 입력 (Cached In)컨텍스트 (Context)라이선스
DeepSeek V4-Flashapi.deepseek.com0.140.280.00281MMIT
...

주목해야 할 세 가지 사항.

첫째, 백만 입력 토큰당 0.14달러인 DeepSeek V4-Flash는 신뢰할 수 있는 에이전트 기반 코딩 (agentic coding)의 최저선입니다. 이보다 저렴한 것은 성능이 낮은 하위 티어입니다. 지난 5월 기사의 가격 데이터는 V3 시대의 것이며 이미 구식이 되었습니다.

둘째, 오픈 웨이트 (open-weights) API 가격은 전년 대비 약 80% 하락했습니다 (inference.net의 제공업체 간 분석에 따르면 2025년 초부터 2026년 초 사이). 중국 제공업체들이 최저가를 주도했으며, 미국 호스팅 업체들은 모델 자체보다는 서비스 속도(serving speed)로 경쟁했습니다.

셋째, 이 목록에서 도구 사용 (tool-use)은 이제 보편화되었습니다. 2026년 중반에 이르러 함수 호출 (function-calling)은 더 이상 차별화 요소가 아니게 되었습니다. 컨텍스트 창 (context windows) 역시 유사하게 팽창했습니다. 128K가 최저선이며, 200K가 일반적이고, 최첨단 (frontier) 모델들은 1M에서 10M까지 밀어붙이고 있습니다.

주의해야 할 함정 하나: **Qwen의 계층형 과금 (tiered billing)**입니다. Alibaba는 입력 토큰 수에 의해 설정된 티어에 따라 전체 요청을 과금합니다. 대화 도중 컨텍스트가 급격히 늘어나는 코딩 에이전트는 단 한 단계 만에 입력 비용이 $1.00/Mtok에서 $6.00/Mtok으로 뛰어오를 수 있습니다. 설정(config) 시 각주로 남겨둘 만한 가치가 있습니다.

주권 (Sovereignty): EU, 미국, 세계

이것은 존재하지 않는 척한다고 해서 사라지는 그림의 정치적 측면입니다. 컴플라이언스 (compliance) 팀이 이에 대해 묻고, 조달 (procurement) 팀도 이에 대해 묻습니다. 따라서:

중국 기반 제공업체 (China-based providers) (DeepSeek, Z.AI/Zhipu, Alibaba/Qwen, Moonshot/Kimi, MiniMax, 01.AI)는 두 가지 측면을 동시에 점유하고 있습니다. 가장 저렴하고 신뢰할 수 있는 프런티어 (frontier) 모델인 동시에, 허용 범위가 넓은 라이선스를 가진 플래그십 가중치 (flagship weights)가 가장 많이 집중되어 있는 곳입니다. 대부분 전반적으로 MIT 또는 Apache 2.0 라이선스를 따릅니다. 데이터 거주성 (data residency)은 호출하는 엔드포인트 (endpoint)에 따라 달라집니다. 싱가포르 국제 엔드포인트는 중국 본토의 관할권 밖에 있지만, 본토 엔드포인트는 그렇지 않습니다.

미국 기반 호스터 (US-based hosters) (Together, Fireworks, Groq, DeepInfra, OpenRouter)는 대부분 자체 모델을 소유하고 있지 않습니다. 이들은 중국의 오픈 가중치 (open weights) 모델을 미국 관할권의 추론 (inference) 비용으로 제공합니다. 중국에서 학습된 역량을 원하면서도 미국 또는 EU의 데이터 거주성을 유지하고 싶을 때 유용합니다. 미국에서 학습된 유일한 오픈 프런티어 (open frontier) 모델 제품군은 커뮤니티 라이선스 (Community License, 오픈되어 있으나 OSI 승인은 아님) 하에 있는 Meta의 Llama 4입니다. OpenAI의 gpt-oss-120B/20B (Apache 2.0)는 완전히 허용적인 라이선스를 가진 유일한 미국의 플래그십 급 오픈 릴리스 (open release)입니다.

EU 기반. Mistral. 이것이 목록의 전부입니다. 주권적 (sovereign) EU 프런티어 역량을 갖춘 유일한 오픈 가중치 스택입니다. GDPR 네이티브이며, La Plateforme는 EU 데이터 센터 (DC)에서 운영됩니다. 하이엔드 급에서는 중국의 대응 모델보다 약간 더 비싸지만, 미국의 폐쇄형 프런티어 (closed frontier) 모델보다는 훨씬 저렴합니다. Codestral, Devstral, Magistral Small, Mistral Large 3, Mistral Small 4는 모두 Apache 2.0입니다. Magistral Medium (reasoning)은 이 라인업에서 유일한 폐쇄형/프리미엄 모델입니다.

만약 귀사의 컴플라이언스 (compliance) 입장이 "고객 데이터가 EU 관할권을 벗어나서는 안 된다"라면, 2026년 중반의 실질적인 해답은 다음과 같습니다: EU 하드웨어에 오픈 가중치를 셀프 호스팅(self-host)하거나, Mistral을 사용하는 것. 이것이 전체 후보 목록입니다.

Ecodex: 캘리브레이션 우선 CLI

먼저 공개합니다: 저는 Empirica에서 일하고 있으며, Ecodex는 Empirica의 CLI 하네스 (harness)입니다. 알파 (Alpha) 단계로, 팀에 의해 매일 운영되며, Claude를 위한 Empirica 시스템을 기반으로 한 주관적인 (opinionated) 도구입니다.

제가 이것을 포함하는 이유는 이것이 이 글의 나머지 부분에서 다루지 않는 축에서 경쟁하기 때문입니다. 위에 언급된 모든 CLI는 동일한 것, 즉 더 나은 편집(edits), 더 나은 컨텍스트(context), 더 나은 도구 사용(tool-use)을 두고 경쟁합니다. Ecodex는 메타인지(metacognition)와 거버넌스(governance) 측면에서 경쟁합니다. 즉, 자신이 알고 있다고 주장하는 바에 대해 책임을 지는 코딩 CLI입니다.

간략한 형태를 설명하겠습니다.

Ecodex는 openai/codex를 포크(fork)하여 Empirica 인식론적 규율(epistemic-discipline) 프레임워크와 결합한 것입니다. 이는 기존의 stock codex가 수행하지 못하는 두 가지 일을 수행합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0