FutureX · Physical AI Daily — Issue 40 (06/27)
요약
onsemi의 Synaptics 인수 제안과 Wujie Power, General Intuition 등 Physical AI 스타트업들의 대규모 투자 유치 소식을 다룹니다. 또한, 대규모 오픈 소스 원격 조작 데이터셋 ABC-130K 공개와 월드 모델의 환각 현상 제어 연구 등 최신 기술 동향을 요약합니다.
핵심 포인트
- onsemi, 70억 달러 규모로 Synaptics 인수 제안하며 Physical AI 진출
- Wujie Power 및 General Intuition 등 AI 스타트업 대규모 투자 유치
- 최대 규모 오픈 소스 원격 조작 데이터셋 ABC-130K 공개
- 월드 모델의 환각 현상을 예측하고 억제하는 새로운 연구 결과 발표
오늘의 주요 뉴스
· onsemi가 엣지 AI (edge AI) 칩 제조사인 Synaptics를 약 70억 달러 규모의 전액 주식 교환 방식으로 인수할 것을 제안하며, 회사의 역대 최대 규모 인수 건으로서 Physical AI 분야에 진입하고 있습니다.
· 중국의 Embodied AI 스타트업인 **Wujie Power (Wujie Dongli)**가 JD.com이 주도하는 2억 달러 이상의 엔젤 라운드를 마감하며, 6개월 만에 누적 엔젤 단계 투자금을 약 28억 위안(RMB)으로 끌어올렸습니다. 또한 이 회사는 약 1억 달러 규모의 주문을 확보했다고 주장합니다.
· General Intuition의 3억 2,000만 달러 규모 Series A 투자가 23억 달러의 기업 가치로 확정되었습니다. 이는 6월 중순 협상 보고 이후 Khosla Ventures가 주도하였으며, Bezos, Schmidt 등이 참여했습니다.
· 현재까지 가장 큰 규모의 오픈 소스 원격 조작 (teleoperation) 데이터셋인 ABC-130K (3,500시간, 130,000개 에피소드, 195개 태스크)가 전체 하드웨어, 학습 및 시뮬레이션 스택과 함께 공개되었습니다.
· 중국의 Physical AI 파운데이션 모델 (foundation model) 스타트업인 Shendu Jizhi가 수억 위안 규모의 추가 라운드 투자를 유치했으며, "인간 학습 (human learning)" 방식을 사용하여 Embodied 파운데이션 모델을 학습시키는 데 집중하고 있습니다.
I. 연구 (Research)
최대 규모의 오픈 소스 원격 조작 데이터셋 ABC: 3,500시간, 130,000개 궤적 · 벤치마크 (benchmark)
모방 학습 (imitation learning)을 위한 오픈 소스 인프라의 주요 추가 사항: ABC는 현재까지 가장 큰 규모의 원격 조작 데이터셋인 ABC-130K를 출시했습니다. 이 데이터셋은 3,500시간, 130,000개 이상의 에피소드, 195개 태스크로 구성되며, 저비용 하드웨어 설계, 학습 프레임워크 및 시뮬레이션 파이프라인과 함께 제공되어 행동 복제 (behavior cloning)를 위한 완전히 재현 가능한 풀스택 시작점을 제공합니다.
Arthur Allshire 외 · arXiv 2606.27375 출처
월드 모델 (World Model)의 "환각 (Hallucinations)"은 예측 가능하며 — 예방할 수 있습니다 · 월드 모델 (world-model)
생성형 월드 모델 (Generative world models)은 점점 더 사실적으로 변하고 있지만, 매끄러워 보이는 영상을 생성하는 동안 실제 역학 (dynamics)으로부터 조용히 벗어나는 경우가 많습니다. Nicklas Hansen과 Xiaolong Wang은 이러한 환각 (hallucinations)이 상태-행동 공간 (state-action space)의 **저커버리지 영역 (low-coverage regions)**에 집중되어 있으며, 경량화된 데이터 측면의 신호 (data-side signals)를 사용하여 이를 국소화하고 억제할 수 있음을 보여줍니다. 이는 신뢰할 수 있는 월드 모델 롤아웃 (world model rollouts)을 위한 진단적 접근 방식을 제공합니다.
Nicklas Hansen, Xiaolong Wang (UC San Diego) · arXiv 2606.27326 source
PhysiFormer: 월드 좌표계에서의 물리 시뮬레이션 학습 (Learning Physical Simulation in World Coordinates) · 월드 모델 (world-model)
대부분의 비디오 월드 모델은 시점 의존적 픽셀 공간 (viewpoint-dependent pixel space)에서 미래 프레임을 예측하며, 이로 인해 물리적으로 일관되지 않은 결과를 생성하는 경우가 많습니다. Andrea Vedaldi 등은 객체를 **월드 좌표계의 3D 메쉬 (3D meshes in world coordinates)**로 표현하는 Diffusion Transformer를 사용하는 PhysiFormer를 제안합니다. 초기 정점 위치 (vertex positions), 속도, 그리고 재질 특성 (강체/탄성)이 주어지면 미래의 정점 궤적 (vertex trajectories)을 샘플링하며, 이는 제어 가능하고 재사용 가능한 물리 시뮬레이션을 향한 단계입니다.
Yiming Chen et al. · arXiv 2606.27364 source
Play2Perfect: 정밀 조립을 위한 숙련된 "놀이" 사전 학습 (Dexterous "Play" Pretraining for Precision Assembly) · 조작 (manipulation)
**정밀 조립 (Precision assembly)**은 접촉이 밀집되어 있으면서도 보상이 희소한 (reward-sparse) 특성을 가집니다. 이는 모방 학습 (imitation learning)이 데이터를 수집하기 어렵고, 강화학습 (RL)이 탐색하기에도 까다롭습니다. Stanford의 C. Karen Liu, Jeannette Bohg 및 동료들은 다지(multi-finger) "놀이(play)" 스타일의 사전 학습에서 실제로 유용한 것이 무엇인지 체계적으로 분석하여, 오랜 과제였던 고정밀 조립을 위한 전이 가능한 사전 학습 레시피를 도출했습니다.
Tyler Ga Wei Lum et al. (Stanford) · arXiv 2606.26428 source
CoStream: 일반화 가능한 복잡한 조작을 위한 단순 행동의 조합 (Composing Simple Behaviors for Generalizable Complex Manipulation) · 조작 (manipulation)
GPU를 PCIe 슬롯에 삽입하는 것과 같이 긴 시간 범위(Long-horizon)를 가지며 접촉이 밀집된(contact-dense) 작업은 **밀리미터 단위의 정밀도 (millimeter-level precision)**와 새로운 작업에 대한 제로샷 일반화 (zero-shot generalization) 능력을 모두 요구합니다. Stanford의 Wenlong Huang 등은 단순한 행동들을 조합하여 복잡한 조작 (manipulation)을 생성하는 CoStream을 제안하며, 이를 통해 엔드투엔드 정책 (end-to-end policies)의 일반화 병목 현상을 완화합니다.
Haonan Chen et al. (Stanford) · arXiv 2606.26423 source
JEPA 월드 모델 (World Models)을 위한 최초의 일반화 이론 · 월드 모델 (world-model)
LeCun이 월드 모델 (world models)로 가는 실행 가능한 경로로 옹호해 온 JEPA (Joint Embedding Predictive Architecture)는 이론적 근거 없이도 경험적인 성공을 입증해 왔습니다. 베이징 대학교의 Wang Yisen 등은 JEPA 월드 모델을 위한 최초의 일반화 이론을 제시하며, 왜 픽셀을 재구성하는 대신 잠재 공간 (latent space)에서 역학 (dynamics)을 예측하는 것이 효과적인지를 설명하고 이 접근 방식에 대한 이론적 토대를 제공합니다.
Jingyi Cui et al. (Peking University) · arXiv 2606.27014 source
OmniContact: 원시 기술의 접촉 흐름 체이닝을 통한 휴머노이드 이동-조작 (Loco-Manipulation) · 이동 (locomotion)
긴 시간 범위의 휴머노이드 이동-조작 (loco-manipulation)은 개별 원시 기술 (primitive skills)의 견고한 실행과 기술 간의 매끄러운 폐루프 (closed-loop) 및 자기 회복 가능한 체이닝 (chaining)을 모두 필요로 합니다. OmniContact는 **접촉 흐름 (contact flow)**을 사용하여 원시 기술들을 체이닝함으로써, 휴머노이드 이동-조작에 대한 일반화 성능과 견고성을 향상시킵니다.
Runyi Yu et al. · arXiv 2606.26201 source
VLA+RL 접근 방식, ICRA 2026 LeHome 챌린지 세탁물 접기 부문 우승 · 조작 (manipulation)
양손을 사용하는 세탁물 접기는 밀집된 접촉과 큰 변형으로 인해 악명 높을 정도로 어려운 작업입니다. 이 접근 방식은 VLA 정책 (VLA policy)에 강화학습 (reinforcement learning) 폐루프를 추가함으로써, ICRA 2026 LeHome 챌린지의 시뮬레이션 트랙에서 62개 팀 중 1위를 차지했으며, 실제 로봇 (real-robot) 트랙에서 준우승을 차지했습니다.
Ilia Larchenko · arXiv 2606.27163 source
오늘의 다른 논문들: TaskNPoint — 휴머노이드에게 몇 분 만에 테니스 백핸드를 가르치기 (2606.26215); "Ace" 전문 수준의 플레이를 목표로 하는 8-DOF 탁구 로봇 하드웨어 설계 (2606.26643); 성능과 일반화의 가교 — 민첩한 비행 RL (강화학습) 정책이 환경 전이 시 실패하는 것을 방지하기 (Scaramuzza 그룹, 2606.27348); Fast LeWorldModel — JEPA 시각적 계획 가속화 (2606.26217); Einstein World Models — 언어를 넘어 복잡한 추론을 확장하기 위해 반사실적 상상 (counterfactual imagination) 사용하기 (2606.26969); VibeAct — 압전 마이크 (piezoelectric microphones)의 진동 신호를 사용하여 접촉 밀도가 높은 정교한 조작 (dexterous manipulation) 구동하기 (2606.27344); HumanoidUMI — 로봇 없이 수집된 시연 데이터로부터 휴머노이드 전신 조작 구동하기 (2606.27239).
오픈 소스 · 도구 · 벤치마크
· PhysEditWorld: 물리적 역학을 암시적 상관관계가 아닌 명시적인 제어 가능 변수로 취급하는 "물리적으로 편집 가능한" 월드 모델 (world models)을 위한 대규모 데이터셋 (arXiv 2606.26694 source).
· NavIsaacLab: Isaac Sim에서 병렬적으로 현실적인 보행자 군중을 생성하는 군중 인식 내비게이션을 위한 오픈 소스 벤치마크 (arXiv 2606.26265 source).
· OctoSense: 스테레오 RGB + 이벤트 카메라, LiDAR, 열화상 이미지, IMU 및 RTK 위치 측정을 특징으로 하는 오픈 소스 멀티모달 센싱 플랫폼 (UPenn, Kostas Daniilidis 외, arXiv 2606.27317 source).
· ForesightSafety-VLA: VLA 모델을 위한 통합 안전 진단 벤치마크 (arXiv 2606.27079 source).
II. 펀딩 및 거래
**Wujie Power (Wujie Dongli, 중국의 범용 Embodied AI 스타트업) | 엔젤 라운드 | 2억 달러 이상 (~RMB 13.6억) · embodied
JD.com 계열 펀드가 주도하였으며, C Capital, Hony Capital, Shengyu Investment, Fengyuan Investment가 참여하였고, 기존 투자자인 Linear Capital, Sequoia China, Huaye Tiancheng, Yarui Capital이 지속적으로 지원하였습니다. 설립자인 Zhang Yufeng(전 Horizon Robotics(중국 자동차 AI 칩 기업)의 지능형 주행 부문 책임자)은 회사의 범용 Embodied AI를 위한 "대뇌-소뇌 통합 (large-brain small-brain integrated)" 접근 방식을 이끌고 있습니다. 2세대 바퀴형 듀얼 암 로봇인 K15는 1,200 TOPS의 연산 능력을 갖추고 양산 단계에 진입했습니다. 이전 라운드를 포함하여 누적 엔젤 단계 투자금은 **약 28억 위안 (RMB 2.8 billion)**에 달하며, 회사는 또한 전 세계적으로 약 1억 달러 규모의 주문을 확보했다고 밝혔습니다 (회사 공시 기준). 출처: Caixin source
General Intuition | 시리즈 A (Series A) | 3억 2,000만 달러 ($320 million) | 기업 가치 23억 달러 ($2.3 billion) · world-model
6월 중순 협상 소식이 보고된 이후, 이번 라운드는 Khosla Ventures가 주도하였으며 Bezos, Schmidt 등이 참여하였습니다. 공개된 총 투자 금액은 약 **4억 5,400만 달러 ($454 million)**에 달합니다. 이 회사의 접근 방식은 게임 플레이 녹화본의 액션 라벨(action labels)—구체적으로 어떤 버튼을 언제 눌렀는지—을 사용하여 시공간 추론 (spatiotemporal reasoning) 능력을 훈련하는 것입니다. 즉, 방대한 양의 게임 리플레이를 AI 에이전트가 현실 세계에서 행동하는 법을 배우기 위한 학습 데이터로 활용합니다. 출처: TechCrunch source
Shendu Jizhi (중국 Physical AI 파운데이션 모델 스타트업) | 신규 라운드 (New Round) | 수억 위안 (Several Hundred Million RMB) · world-model
이전 라운드에서도 수억 위안(RMB) 규모의 투자를 유치한 데 이어, 이 회사는 물리적 AI (Physical AI) 파운데이션 모델 (Foundation Model) 개발을 가속화하기 위해 추가로 **수억 위안 (Several Hundred Million RMB)**을 조달했습니다. 이 회사의 접근 방식은 "인간 학습 (Human Learning)" 패러다임에 집중되어 있으며, 인간의 시연 데이터 (Human Demonstration Data)에 베팅하는 해외 기업들과 차별화하여 인간이 학습하는 방식과 더 유사하게 구체화된 (Embodied) 파운데이션 모델을 훈련하는 것을 목표로 합니다. 출처: Sina Finance source
Zhicheng AI | 두 달 만에 두 차례의 라운드 (Two Rounds in Two Months) · world-model
Huawei 미국 연구소의 전 CTO가 이끄는 이 회사는 두 달 만에 두 차례의 투자 라운드를 마감했습니다. 이 기간 동안 회사는 "Chengling" 물리적 지능 월드 모델 (Physical Intelligence World Model) V0.1을 오픈 소스로 공개했으며, 업데이트된 휴머노이드 (Humanoid) 제품인 TR4 Pro와 TR5 Pro를 출시했습니다. 출처: Zhidongxi source
Oula Wanxiang | 엔젤 라운드 (Angel Round) | 수억 위안 (Several Hundred Million RMB) · embodied
국영 대기업인 China Merchants Group의 투자 부문인 China Merchants Capital로부터 투자를 받았으며, 조달된 자금은 자체적인 구체화된 (Embodied) 월드 모델 개발, 로봇 하드웨어 제조 확장, 그리고 글로벌 개발자 생태계 구축에 투입될 예정입니다. 출처: Central Enterprise Investment Association source (WeChat, CN)
Juwei Technology | 시리즈 B1 (Series B1) | 수억 위안 (Several Hundred Million RMB) | 기업 가치 약 40억 위안 (Valuation Nearly RMB 4 Billion) · embodied
수억 위안 규모의 시리즈 B1 라운드를 마감했으며, 투자 후 기업 가치 (Post-money Valuation)는 약 **40억 위안 (RMB 4 billion)**에 달합니다. 출처: Guandian.cn source
Qunqing Intelligence | 신규 라운드 (New Round) | 약 1억 위안 (Nearly RMB 100 Million) · industrial
이 회사는 "공장 현장 (factory floor)"에서 성장하는 구체화된 지능 (Embodied Intelligence)에 집중하며, 실제 산업 현장 배치 및 폐쇄 루프 운영 (Closed-loop operation)을 목표로 합니다. 출처: 36Kr Hardtech source (WeChat, CN)
III. 상용화 및 배치 (Commercialization & Deployment)
UBTECH, 2주 만에 반려 로봇 약 5,000대 예약 주문 달성 · 휴머노이드 (humanoid) ⚠️ 예약 주문 수치
UBTECH (중국 휴머노이드 로봇 기업)는 소비자 시장 진입을 시도하며, 자사의 소비자용 반려 로봇 (U1)에 대해 2주 만에 약 5,000건의 예약 주문을 기록했다고 보고했습니다. 예약 주문 수치는 실제 인도 및 유지율과는 별개이며, 이것이 지속적인 출하로 이어질지는 지켜봐야 합니다. 출처: Pandaily source
Waymo, 독일 법인 등록 및 내슈빌 차량 함대 확장 지속 · 자율주행 (autonomy)
Waymo는 독일에서 법인 등록을 완료하여 유럽 시장 진입을 위한 기반을 마련했으며, 동시에 미국 **내슈빌 (Nashville)**에서 차량 함대 (fleet) 확장을 지속하고 있습니다. 등록 및 도로 테스트는 초기 단계이며, 대규모 상업 운영까지는 아직 거리가 있습니다. 출처: Automotive World source
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기