본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 15. 05:34

MiMo SoloEngine: Xiaomi AI 퍼즐의 마지막 조각

요약

Xiaomi가 향후 3년간 AI 분야에 600억 위안을 투자하며 AI 기업으로의 전환을 가속화하고 있습니다. MiMo LLM, 에이전트 플랫폼 등 탄탄한 AI 계층 구조를 구축했으나, 비즈니스 가치 극대화를 위한 마지막 조각인 MiMo SoloEngine의 역할을 강조합니다.

핵심 포인트

  • Xiaomi, 향후 3년간 AI 분야에 최소 600억 위안 투자 계획
  • MiMo 모델 제품군을 통한 강력한 파운데이션 모델 계층 구축
  • 모바일 시스템 레벨 AI 에이전트 'miclaw' 및 에코시스템 플랫폼 공개
  • 인프라, 모델, 애플리케이션을 잇는 SoloEngine의 중요성 부각

Lei Jun은 Weibo에 다음과 같은 수치들을 게시했습니다: Xiaomi는 향후 3년 동안 AI 분야에 600억 위안(RMB)을 투자할 것입니다. 2026년 한 해에만 최소 160억 위안을 투자할 예정입니다. 1분기 R&D(연구개발) 지출은 90억 위안으로 전년 대비 33.4% 증가했습니다. R&D 인력은 26,048명입니다. 모두 역사적 최고치입니다.

Xiaomi는 휴대폰 회사에서 AI 회사로 변모하고 있습니다. 하지만 자세히 살펴보면, Xiaomi의 AI 지도는 이미 상당히 완성된 것처럼 보입니다 — MiMo LLM(대규모 언어 모델), miclaw 휴대폰 Agent(에이전트), Agent Ecosystem Platform(에이전트 생태계 플랫폼), 10억 개의 IoT(사물인터넷) 기기, 7억 4,600만 명의 월간 활성 사용자(MAU). 갖춰져야 할 모든 것이 갖춰져 있습니다.

Lei Jun은 분명히 만족하지 못하고 있습니다. 그는 빠진 조각을 찾고 있습니다. 그 조각 없이는 600억 위안의 투자가 비즈니스 가치로 온전히 전환될 수 없습니다.

그 조각은 바로 MiMo SoloEngine입니다.

1. Xiaomi의 AI 지도: 4개의 계층, 마지막 하나만이 누락됨

Xiaomi Group의 President(사장) Lu Weibing은 2026년 1분기 실적 발표에서 Xiaomi의 3계층 AI 아키텍처(architecture)를 상세히 설명했습니다. 기반 인프라를 포함하면 실제로는 4개의 계층입니다.

Layer 1: Infrastructure (인프라). Xiaomi는 약 2,206억 위안의 현금 보유액, 26,048명의 R&D 인력, 그리고 1분기 90억 위안의 R&D 지출을 보유하고 있습니다. 600억 위안은 최저 기준이며, 실제 투자는 이보다 더 높을 것입니다.

Layer 2: Foundation models (파운데이션 모델). MiMo 모델 제품군이 완전히 형성되었습니다: V2.5-Pro (플래그십 Agent 모델 — 조 단위 파라미터, 백만 토큰 컨텍스트 윈도우), V2.5 (멀티모달 파운데이션), V2-Omni, V2-TTS, 그리고 OneVL 자율 주행 모델입니다. V2.5-Pro는 Artificial Analysis의 General Intelligence Index(일반 지능 지수)와 Agent Index(에이전트 지수) 모두에서 오픈 소스 모델 중 세계 1위를 차지했습니다. 토큰 효율성은 Claude Opus 4.6 및 GPT-5.4보다 40%~60% 더 낮습니다(효율적입니다). 6월 11일에 막 출시된 MiMo Code는 코딩 Agent 능력을 새로운 차원으로 끌어올립니다.

Layer 3: AI 애플리케이션 배포 (AI application deployment). miclaw phone Agent가 클로즈 베타(closed beta)에 진입했습니다. 이는 50개 이상의 내장 시스템 도구를 갖춘 중국 최초의 모바일 시스템 레벨 AI Agent입니다. Agent 에코시스템 플랫폼 (dev.mi.com) 또한 오픈 베타(open beta)에 진입했습니다. Miloco 전용 홈 인텔리전스(whole-home intelligence)가 AWE2026에서 데뷔했습니다. HyperOS는 전 세계적으로 11억 개의 기기를 연결하고 있으며, 월간 활성 사용자 수(MAU)는 7억 4,600만 명에 달합니다.

Xiaomi의 AI 지도는 완성된 것처럼 보입니다. 하지만 CCID Consulting의 분석가 Bai Runxuan은 결정적인 격차를 지적했습니다. 현재의 Agent 가치 사슬은 "양 끝은 뜨겁지만 중간은 비어 있는(hot at both ends, hollow in the middle)" 패턴을 보이고 있습니다. 상류(upstream)의 거대 모델(large models)과 칩(chips)은 자본이 넘쳐나고, 하류(downstream)의 시나리오 수요는 강력하지만, 중간 단계(midstream)에는 산업 지식을 신뢰할 수 있는 Agent로 전환할 수 있는 엔지니어링 플랫폼이 부족하다는 것입니다.

Xiaomi의 지도는 이러한 진단을 완벽하게 확인시켜 줍니다. 파운데이션 모델(foundation models)이 있고, 엔드 유저(end-user) 기기가 있으며, 에코시스템 플랫폼이 있습니다. 부족한 것은 바로 가교(bridge), 즉 "평범한 사람들"이 이러한 리소스를 사용하여 Agent를 구축할 수 있게 해주는 플랫폼입니다.

2. 87%와 10% 사이의 격차

AIGC2026 서밋에서 Amazon Web Services는 한 가지 데이터 포인트를 공개했습니다. 기업의 87%가 AI를 대규모로 배포했다고 주장하지만, 실제로 그로부터 가치를 얻은 기업은 10%에 불과하다는 것입니다.

이 두 숫자 사이의 격차는 핵심적인 모순을 드러냅니다. Agent에 대한 시장 수요는 막대하지만, Agent를 구축하는 능력은 개발자들의 손안에 갇혀 있다는 점입니다.

오늘날 AI Agent를 구축하는 방법은 단 두 가지뿐입니다. 첫 번째는 Dify나 n8n과 같은 로우코드(low-code) 워크플로우(Workflow) 플랫폼입니다. 이들은 사용자가 노드(node)를 드래그 앤 드롭하여 AI 애플리케이션을 구축할 수 있는 시각적 캔버스를 제공합니다. 하지만 핵심 로직은 "사전 설정된 경로(preset paths)"입니다. 즉, if/else 조건문을 사용하여 흐름을 제어할 뿐, 진정한 자율적 의사결정(autonomous decision-making)은 지원하지 않습니다. 이는 마치 지하철 노선도와 같습니다. 모든 노선과 모든 역이 미리 계획되어 있으며, 열차는 정해진 궤도 위에서만 달릴 수 있습니다.

두 번째 경로는 LangChain이나 CrewAI와 같은 코드 기반 개발 프레임워크 (code-based development frameworks)입니다. 이들은 진정한 에이전트형 AI (Agentic AI) — 즉, 에이전트가 자율적인 결정을 내리고 전략을 동적으로 조정할 수 있는 기능 — 를 지원하지만, Python 프로그래밍 기술을 요구합니다. 변호사는 LangChain을 사용할 수 없습니다. 회계사는 ReAct 에이전트 (ReAct Agent)를 설정할 수 없습니다. 운영 관리자는 Python을 작성할 수 없습니다.

이는 명백한 시장의 격차를 만들어냅니다: 로우코드 플랫폼 (low-code platforms)은 배우기 쉽지만 진정한 자율적 의사결정을 지원하지 못하며, 코드 프레임워크는 자율적 의사결정을 지원하지만 개발자만이 사용할 수 있습니다.

MiMo SoloEngine은 바로 이 격차를 메웁니다.

3. SoloEngine: Xiaomi AI 생태계의 가교

SoloEngine은 최초의 로우코드 에이전트형 AI (Agentic AI) 개발 플랫폼입니다.

이 플랫폼은 ReAct 아키텍처 (ReAct architecture), 도구 호출 (tool calling), MCP 프로토콜 (MCP protocol), 기술 (Skills), 그리고 서브 에이전트 (SubAgents)를 모두 백그라운드에서 패키징합니다. 사용자는 브라우저를 열고, 캔버스 위에 에이전트를 드래그하여 배치하고, 협업 관계를 연결하며, 필요한 도구를 구성한 뒤 실행 버튼을 클릭하기만 하면 됩니다. 백엔드는 이 모든 것을 전용 에이전트형 AI 시스템으로 자동 컴파일합니다.

이 시스템은 워크플로우 (Workflow)가 아닙니다 — 즉, 미리 설정된 경로를 따르지 않습니다. 각 에이전트는 ReAct 루프(loop) — 생각(think) → 행동(act) → 관찰(observe) → 반복(repeat) — 를 실행하며, 현재 상황에 따라 실시간 판단을 내립니다. 예상치 못한 상황에 직면하면 스스로 전략을 조정합니다. 더 나은 접근 방식을 발견하면 스스로 경로를 전환합니다.

차원 (Dimension)Dify/n8nLangChain/CrewAISoloEngine
진정한 에이전트 AI (True Agentic AI) 지원✗ 워크플로우 전용 (사전 설정된 경로)✓ ReAct / 멀티 에이전트 (multi-Agent)✓ ReAct / 멀티 에이전트 (multi-Agent)
...

SoloEngine은 또한 **점진적 공개 (progressive disclosure)**를 지원합니다. 도구(tools), 기술(Skills), 그리고 MCP 프로토콜이 필요할 때만 로드되어 토큰 (Token) 소비를 85% 이상 절감합니다. **통합 어댑터 계층 (unified adapter layer)**은 OpenAI, Anthropic, Ollama, MiMo, DeepSeek, Qwen, Zhipu 등 모든 주요 모델을 하나의 인터페이스로 커버하여 원활한 전환을 지원합니다. **원클릭 패키징 (One-click packaging)**을 통해 완성된 에이전트 (Agent) 팀을 완전한 제품으로 번들링하여 누구나 사용할 수 있도록 준비할 수 있습니다.

4. SoloEngine, Xiaomi의 모든 자원을 연결하다

MiMo의 모델 역량, 99% 절감된 API 비용, 10억 개의 IoT 기기, 에이전트 생태계 플랫폼 (Agent Ecosystem Platform), miclaw 폰 에이전트 (miclaw phone Agent) — 이 모든 자원은 SoloEngine에 의해 연결되어, 다른 플랫폼이 쉽게 복제할 수 없는 생태계 해자 (ecosystem moat)를 형성합니다.

MiMo 모델은 SoloEngine 에이전트의 "두뇌"를 제공합니다. 수조 개의 파라미터 (parameters), 수백만 토큰의 컨텍스트 (context), 그리고 세계 1위의 오픈 소스 추론 (reasoning) 능력을 갖추고 있습니다.

99% 더 저렴한 API는 SoloEngine 사용자의 운영 비용을 최저 수준으로 낮춥니다. 3개의 에이전트 협업 팀을 운영하는 비용이 한 달에 300 RMB 미만입니다.

10억 개의 IoT 기기는 SoloEngine이 오케스트레이션 (orchestration)하는 에이전트가 에어컨부터 도어락, 카메라에서 로봇 청소기에 이르기까지 물리적 세계를 직접 제어할 수 있게 합니다.

**에이전트 생태계 플랫폼 (Agent Ecosystem Platform)**은 SoloEngine 기반으로 구축된 에이전트 팀이 배포되고 판매될 수 있도록 하여, "나 혼자 사용하는 것"에서 "누구나 사용할 수 있는 것"으로 확장시킵니다.

**miclaw 폰 에이전트 (miclaw phone Agent)**는 SoloEngine의 오케스트레이션 역량을 모바일로 확장합니다. 사용자는 휴대폰에서 바로 에이전트 팀에게 작업을 수행하도록 지시할 수 있습니다.

OpenAI가 여전히 AgentKit을 GPT-5 생태계 안에 가두어 두고 있는 동안, Xiaomi는 이미 MiMo와 SoloEngine을 결합하여 에이전트 구축 장벽을 제로(0)로 낮추었습니다.

5. OPC 시대를 위한 인프라

중국의 1인 유한책임회사(one-person limited liability companies)는 이미 1,600만 개를 넘어섰으며, 이는 전체 기업의 27.4%를 차지합니다. 2026년은 20개 이상의 도시가 전용 OPC 지원 정책을 도입함에 따라 "OPC의 원년"이라 불리고 있습니다.

이러한 "1인 기업"들의 핵심 요구사항은 AI 에이전트 (AI Agents)를 사용하여 전통적인 팀을 대체하고, "1인 군대"가 되는 것입니다. 하지만 LangChain은 프로그래밍 기술을 요구하며, Dify의 워크플로우 (Workflow)는 진정한 자율적 의사결정을 지원하지 않습니다.

SoloEngine은 바로 이 시대를 위해 구축된 인프라입니다.

변호사는 SoloEngine을 사용하여 법무 에이전트 (legal affairs Agent) 팀을 구축하여, 한 사람이 세 명의 몫을 해냅니다. 회계사는 SoloEngine을 사용하여 재무 분석 에이전트 (financial analysis Agent) 팀을 구축하여, 보고서와 세무 자문을 자동으로 생성합니다. 운영 관리자는 SoloEngine을 사용하여 마케팅 에이전트 (marketing Agent) 팀을 구축하여, 한 사람이 6개의 온라인 쇼핑몰을 운영합니다.

MiMo는 에이전트의 "두뇌"를 제공하고, SoloEngine은 에이전트의 "손과 발"을 제공합니다. 600억 위안(RMB) 투자 퍼즐의 마지막 조각이 마침내 맞춰졌습니다.

SoloEngine의 포지셔닝: 워크플로우 (Workflow) 없음. 오케스트레이션 (orchestration) 코드 없음. 오직 일을 완수하는 에이전트 (Agents)뿐.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0