LLM이 에이전트 지형을 재편한 이후, Lei Jun의 다음 행보

5월 27일 이른 새벽, Xiaomi의 기술 팀이 발표를 내놓았습니다. MiMo-V2.5 API 라인업의 가격을 최대 99%까지 영구적으로 인하하며, 컨텍스트 윈도우 (context window)에 따른 계층적 가격제를 완전히 폐지한다는 내용이었습니다. Lei Jun은 이 소식을 공유했습니다.

가격 인하 자체는 놀라운 일이 아니었습니다. DeepSeek가 2주 전에 이미 동일한 조치를 취했고, 시장은 거의 동요하지 않았기 때문입니다. 업계의 진정한 관심을 끈 것은 별개의 뉴스였습니다. 6월 3일, Xiaomi는 자사의 오픈 소스 프로젝트인 SoloEngine의 최신 버전을 출시했습니다. 이는 최초의 로우코드 (low-code) 에이전틱 AI (Agentic AI) 개발 플랫폼입니다.

I. Xiaomi의 AI 연간 검토: 7B에서 조 단위 파라미터의 강자로

AI 분야에서 Xiaomi의 속도는 대부분의 예상을 뛰어넘었습니다.

2025년 4월, MiMo-7B가 오픈 소스로 공개되었습니다. 수학적 추론과 코딩 벤치마크에서 OpenAI o1-mini를 능가하는 7B 파라미터 모델의 등장은 처음에 의구심을 불러일으켰습니다. Artificial Analysis가 자체 리더보드(leaderboard)를 통해 해당 결과를 검증하고 나서야 회의론이 가라앉았습니다.

2025년 말, Lei Jun은 DeepSeek 출신의 Luo Fuli를 영입했습니다. 1995년 이후 출생인 그녀는 업계에서 "AI 신동"이라 불리는 DeepSeek-V2의 핵심 개발자였습니다. 그녀는 Xiaomi에서 평균 연령 25세의 100명 규모 팀을 구성했으며, 그중 60% 이상이 칭화대학교와 베이징대학교 출신이었습니다. 단 100명의 핵심 팀으로 글로벌 오픈 소스 모델들 사이에서 최상위권 수준을 달성한 것은 업계에서 매우 이례적인 일입니다.

2026년 봄 출시 행사에서 Lei Jun은 MiMo-V2-Pro, V2-Omni, V2-TTS라는 세 가지 독자적인 LLM을 한꺼번에 공개하며, 향후 3년간 600억 위안의 AI 투자를 약속했습니다. 비슷한 시기에 휴대폰 기반 에이전트인 miclaw가 클로즈 베타(closed beta)에 진입했습니다. 이는 모바일 기기 상의 중국 최초 시스템 레벨 AI 에이전트로, 작업을 자율적으로 분해하고, 시스템 기능을 호출하며, Mijia IoT 기기들과 협업할 수 있는 50개 이상의 시스템 도구를 탑재하고 있습니다.

4월, MiMo-V2.5 시리즈가 MIT 라이선스 하에 오픈 소스(Open Source)로 공개되었습니다. 출시 당일, 이미 Alibaba의 T-Head, AMD, Baidu의 Kunlun, Enflame, Muxi, Tianshu Zhixin, 그리고 Amazon Web Services를 포함한 7개의 국내 칩 플랫폼에 적응된 상태였습니다. 이와 동시에 진행된 100조 토큰 인센티브 프로그램은 30일 이내에 100조 개의 토큰을 무료로 배포했습니다. 이 기간 동안 Xiaomi의 에이전트 (Agent) 생태계 플랫폼 또한 퍼블릭 베타(Public Beta)에 진입했습니다.

5월, MiMo-V2.5-Pro는 GDPVal-AA 벤치마크에서 1581점을 기록하며 DeepSeek-V4-Pro와 GLM-5.1을 제치고 글로벌 오픈 소스 모델 중 1위를 차지했습니다. Hermes Agent는 OpenRouter의 글로벌 사용량 차트에서 정상을 차지하며, 일일 호출량 2,910억 토큰을 달성했습니다. OneVL 자율주행 모델이 오픈 소스로 공개되었습니다. 그 뒤를 이어 99% 영구 가격 인하가 이어졌습니다.

내부 테스트에서 MiMo-V2.5-Pro는 베이징 대학교의 컴파일러 이론 과정인 SysY 컴파일러 프로젝트를 4.3시간 만에 완료했습니다. 이는 일반적으로 베이징 대학교 학부생들이 완료하는 데 몇 주가 걸리는 프로젝트로, MiMo-V2.5-Pro는 진행 과정에서 672회의 도구 호출 (Tool Invocations)을 통해 233/233점이라는 만점을 기록했습니다.

작은 7B 모델에서 조 단위 파라미터의 플래그십 모델로, 추격자에서 선두주자로. Xiaomi는 이를 1년도 채 되지 않아 해냈습니다.

하지만 파운데이션 모델 (Foundation Model)이 아무리 강력하더라도, 그것은 본질적으로 단지 "두뇌"일 뿐입니다. Lei Jun이 다음에 하고자 하는 것은 그 두뇌에 한 쌍의 손을 달아주는 것입니다.

II. SoloEngine이 에이전트 지형을 재편하는 방식

SoloEngine이 왜 중요한지 이해하려면, 먼저 핵심적인 차이점인 에이전틱 AI (Agentic AI)와 워크플로 (Workflows)의 차이를 파악해야 합니다.

에이전틱 AI (Agentic AI)는 이미 개발자들 사이에서 큰 호응을 얻고 있습니다. Claude Code는 단일 터미널 프롬프트만으로 요구사항 분해 (requirement decomposition), 코드 작성, 테스트 및 배포를 처리할 수 있습니다. ByteDance의 Trae는 SOLO 모드에서 AI가 자율적으로 개발을 진행하게 하며, 개발자는 검토와 승인만 하면 됩니다. 하지만 이러한 도구들은 개발자 전용입니다. 비프로그래머를 위한 AI 애플리케이션을 구축하는 방식은 전통적으로 두 가지 접근법으로 나뉘어 왔습니다.

첫 번째는 Dify나 n8n과 같은 **로우코드 워크플로 플랫폼 (low-code workflow platforms)**입니다. 이들은 사용자가 노드를 드래그 앤 드롭하고, 데이터 흐름을 연결하며, AI 애플리케이션을 빠르게 조립할 수 있는 시각적 캔버스를 제공합니다. 하지만 이들의 핵심 로직은 "사전 설정된 경로 (preset paths)"에 의존합니다. 사용자는 캔버스 위에 A단계에서 B단계, C단계로 이어지는 경로를 배치하고 if/else 조건문을 사용하여 분기점을 제어합니다. 전체 프로세스는 지하철 노선도와 같습니다. 모든 노선과 모든 역이 사전에 계획되어 있으며, 열차는 정해진 궤도 위에서만 달릴 수 있습니다. 계획되지 않은 상황에 직면하면 워크플로가 깨져버립니다.

두 번째는 LangChain이나 CrewAI와 같은 **코드 기반 개발 프레임워크 (code-based development frameworks)**입니다. 이들은 Python 프로그래밍 기술을 요구하며, 사용자가 코드를 통해 AI 에이전트 (AI Agent)의 역할, 도구, 협업 로직을 정의할 수 있게 합니다. 이들은 진정한 에이전틱 AI (Agentic AI)를 지원합니다. 즉, 에이전트가 자율적인 결정을 내리고 전략을 동적으로 조정할 수 있습니다. 하지만 진입 장벽이 매우 높습니다. 변호사는 LangChain을 사용하지 않을 것이며, 회계사는 ReAct 에이전트 (ReAct Agent)를 설정할 수 없습니다. 마케팅 매니저는 Python을 작성하지 않습니다.

이는 명백한 시장의 공백을 만들어냅니다. 로우코드 플랫폼은 사용하기 쉽지만 진정한 자율적 의사결정을 지원하지 못하고, 코드 프레임워크는 자율적 의사결정을 지원하지만 프로그래머들만 접근할 수 있습니다.

Manus와 2026년 초 화제가 되었던 OpenClaw는 모든 것을 할 수 있지만 무엇 하나 특출나지 않은 범용적 (generalist) 경로를 시도했습니다. 범용 에이전트 (General-purpose Agents)는 상업적 요구사항을 충족하는 데 어려움을 겪습니다.

SoloEngine은 바로 이 공백을 정확히 메웁니다.

SoloEngine은 수직적 접근 방식(vertical approach)을 취합니다. 즉, 모든 분야를 다루는 만능 조수(jack-of-all-trades assistant)가 되려고 노력하는 대신, 모든 산업 분야의 도메인 전문가(domain experts)가 자신의 특정 작업을 위해 정밀하고 재사용 가능한 에이전트 AI (Agentic AI) 도구를 구축할 수 있도록 지원합니다.

SoloEngine은 각 에이전트(Agent)가 "생각(think) → 행동(act) → 관찰(observe) → 반복(repeat)" 루프를 실행하는 에이전트 AI (Agentic AI) 아키텍처를 사용합니다. 이는 에이전트가 미리 설정된 경로를 따르는 것이 아니라, 실시간으로 상황을 평가하고 즉석에서 의사결정을 내린다는 것을 의미합니다. 예상치 못한 일이 발생하면 스스로 전략을 조정하며, 더 나은 접근 방식이 나타나면 선제적으로 경로를 전환합니다. 전체 과정에서 사용자의 if/else 조건문이나 가능한 모든 경로에 대한 사전 계획이 필요하지 않습니다.

SoloEngine을 사용하는 것은 근본적으로 다른 모든 것과 다릅니다. 사용자는 브라우저를 열고, 캔버스(canvas)에 에이전트를 드래그 앤 드롭하고, 협업 관계를 연결하며, 필요한 도구를 구성한 뒤 실행 버튼을 누르기만 하면 됩니다. 백엔드(backend)는 시각적 설계를 실행 가능한 에이전트 AI (Agentic AI) 시스템으로 자동 컴파일합니다. 이 시스템은 작업을 계획하고, 작업을 실행하며, 실시간 피드백을 제공하며, 사용자는 오직 검토하고 확인하기만 하면 됩니다.

코드 한 줄 필요 없습니다. 구성을 위한 if/else 로직도 필요 없습니다.

구체적인 시나리오를 예로 들어보겠습니다. 변호사가 캔버스에 "계약서 검토 에이전트(Contract Review Agent)"를 드래그하고, "법률 조항 검색 에이전트(Legal Statute Search Agent)"와 "리스크 탐지 에이전트(Risk Flagging Agent)"를 추가한 뒤, 이들의 협업 관계를 연결하고 실행을 누릅니다. 30분 후, 37개의 리스크 지점이 표시된 계약서 검토 보고서가 자동으로 생성됩니다. 전체 과정은 노코드(zero-code)로 이루어집니다.

다음은 SoloEngine이 주류 옵션들과 비교했을 때 어떤 차별점을 갖는지에 대한 내용입니다:

	Dify/n8n	LangChain/CrewAI	SoloEngine
진정한 에이전트 AI (True Agentic AI) 지원	✗ 사전 설정된 경로의 워크플로우만 가능	✓ ReAct / 멀티 에이전트 (multi-Agent)	✓ ReAct / 멀티 에이전트 (multi-Agent)
...
점진적 공개 (Progressive disclosure)—도구, 기술 (Skills), 그리고 MCP 프로토콜이 필요할 때만 로드되므로, 에이전트가 실제로 필요한 도구만 호출하여 복잡한 작업에서 토큰 소비량을 85% 이상 절감합니다. 통합 적응 계층 (Unified adaptation layer)—OpenAI, Anthropic, Ollama, MiMo, DeepSeek, Tongyi Qianwen, Zhipu를 포함한 모든 주요 모델을 지원하며, 단일 인터페이스를 통해 원활한 전환이 가능하고 특정 벤더에 종속되지 않습니다. 원클릭 패키징 (One-click packaging)—조립된 에이전트 팀을 누구나 직접 사용할 수 있는 완전한 제품으로 패키징할 수 있습니다.

III. 샤오미(Xiaomi)가 에이전트 분야에 진입하는 이유

샤오미는 이미 MiMo 파운데이션 모델 (foundation model)을 보유하고 있습니다. 그런데 왜 개발 플랫폼을 구축하는 데 자원을 투자하는 것일까요?

중국의 기업용 AI 에이전트 시장은 2026년에 430억 위안을 넘어설 것으로 전망됩니다 (IDC 데이터). 하지만 AIGC2026 서밋에서 Amazon Web Services는 놀라운 통계를 공개했습니다. 기업의 87%가 AI를 대규모로 배포했다고 주장하지만, 실제로 거기서 실질적인 가치를 추출해낸 기업은 10%에 불과하다는 것입니다. 이 두 수치 사이의 간극은 핵심적인 모순을 드러냅니다. 즉, 에이전트에 대한 수요는 엄청나지만, 이를 구축하는 능력은 여전히 프로그래머들의 손에 갇혀 있다는 점입니다.

CCID Consulting의 분석가 바이 룬쉬안(Bai Runxuan)은 이를 생생하게 표현했습니다. 현재의 에이전트 산업 체인은 "양 끝은 뜨겁지만 중간은 비어 있는" 패턴을 보이고 있다고 말입니다. 상류(Upstream)의 파운데이션 모델과 칩은 자본을 끌어모으고, 하류(Downstream)의 유스케이스(use-case) 수요는 강력합니다. 하지만 중류(Midstream)에는 도메인 전문 지식을 신뢰할 수 있는 에이전트로 변환할 수 있는 엔지니어링 플랫폼이 부족한 실정입니다.

주목할 만한 또 다른 신호는 1인 기업(OPCs, One-Person Companies)의 폭발적인 증가입니다. 전국적으로 1인 유한회사가 1,600만 개를 넘어섰으며, 이는 전체 기업의 27.4%를 차지합니다. 2026년은 '1인 기업의 해'로 불리고 있으며, 20개 이상의 도시가 1인 기업을 위한 전용 지원 정책을 내놓고 있습니다. 이러한 1인 기업들의 핵심 니즈는 전통적인 팀을 AI 에이전트(AI Agents)로 대체하여 '1인 1군단'을 달성하는 것이지만, LangChain은 코딩 기술을 요구하며, Dify의 워크플로(Workflows)는 진정한 자율적 의사결정을 지원하지 못합니다.

Xiaomi의 위치는 독보적입니다. 이들은 Agent Index의 오픈 소스 모델 중 세계 1위를 기록한 MiMo 파운데이션 모델(Foundation Model)을 보유하고 있으며, 10억 개의 IoT 기기와 7억 4,600만 명의 월간 활성 사용자(MAU)를 갖춘 생태계를 보유하고 있습니다. 또한 99%의 가격 인하 이후 압도적으로 경쟁력 있는 API 비용을 갖추고 있습니다. 하지만 비기술 사용자가 실제로 쉽게 배우고 사용할 수 있는 에이전트 구축 플랫폼이 없다면, 이러한 자원 중 그 어느 것도 상업적 가치로 완전히 전환될 수 없습니다.

SoloEngine이 이 문제를 해결할 열쇠입니다. MiMo가 에이전트의 '두뇌'를 제공한다면, SoloEngine은 에이전트의 '손과 발'을 제공합니다. 이 둘이 결합함으로써 Xiaomi는 '모델 구축'의 전략적 단계에서 '플랫폼 구축' 및 '서비스 구축' 단계로 격상됩니다.

Xiaomi의 생태계 우위는 SoloEngine을 통해 더욱 증폭됩니다. MiMo의 모델 역량, 99% 저렴해진 API 비용, 10억 개의 IoT 기기, 에이전트 생태계 플랫폼, miclaw 폰 에이전트 등 이러한 자원들은 SoloEngine에 의해 하나로 엮여 다른 플랫폼이 쉽게 복제할 수 없는 생태계 해자(Moat)를 형성합니다.

OpenAI가 여전히 AgentKit을 GPT-5 생태계에 가두어 두려 하는 동안, Xiaomi는 MiMo와 SoloEngine의 조합을 통해 에이전트 구축 장벽을 이미 제로(0)로 낮추었습니다.

에이전트 지형의 이러한 지각 변동의 중심에는 Xiaomi와 새롭게 출시된 SoloEngine이 서 있습니다.

SoloEngine의 슬로건이 말해주듯: 워크플로도, 오케스트레이션(Orchestration) 코드도 필요 없습니다. 그저 일을 완수하는 에이전트가 있을 뿐입니다.

LLM이 에이전트 지형을 재편한 이후, Lei Jun의 다음 행보

요약

핵심 포인트

I. Xiaomi의 AI 연간 검토: 7B에서 조 단위 파라미터의 강자로

II. SoloEngine이 에이전트 지형을 재편하는 방식

III. 샤오미(Xiaomi)가 에이전트 분야에 진입하는 이유

댓글