FutureX · Physical AI Daily — Issue 49 (07/06)
요약
CATL과 Galbot의 휴머노이드 협력, WeRide의 로보택시 서비스 시작 등 로보틱스 산업 동향을 다룹니다. 또한, 1인칭 시점의 손-물체 접촉 기하학을 연구하는 EPIC-Contact 데이터셋과 HOPformer 모델을 소개합니다.
핵심 포인트
- CATL-Galbot, 휴머노이드 로봇 사후 서비스 표준 공동 구축
- WeRide, 싱가포르 푼골 지역에서 로보택시 운영 개시
- UN, 자율 주행 시스템에 관한 글로벌 기술 규정 승인
- EPIC-Contact 데이터셋을 통한 정밀한 손-물체 접촉 모델링 연구
오늘의 주요 뉴스
· CATL과 Galbot이 글로벌 전략적 파트너십을 체결했습니다. Galbot의 고중량 휴머노이드(humanoid)인 Galbot S1(50kg 듀얼 암 페이로드, 8시간 배터리 수명)이 현재 CATL의 배터리 셀/모듈 생산 라인에서 고강도 자재 취급 작업을 수행하고 있으며, 양사는 세계 최초의 휴머노이드 로봇 사후 서비스(after-sales service) 표준을 공동 구축하고 있습니다.
· WeRide가 Grab과 협력하여 싱가포르 푼골(Punggol)에서 공개 로보택시(robotaxi) 운영을 시작했습니다. 이는 해당 지역에서 대중에게 공개된 최초의 자율 주행 모빌리티(autonomous mobility) 서비스로, 해당 차량군은 30,000km 이상의 안전 주행 기록을 달성했으며 2026년 중반까지 상용화로 전환될 예정입니다.
· 중국, EU, 미국, 영국, 캐나다, 일본이 공동으로 주도하는 **UN 자율 주행 시스템에 관한 글로벌 기술 규정(UN Global Technical Regulation on Automated Driving Systems)**이 모든 체결국의 투표를 통해 승인되었으며, 이로써 L4 준수 배포를 위한 통합 기술 표준 프레임워크가 구축되었습니다.
· Hidriv(希迪智驾) — 선도적인 광산 트럭 자율 주행 기업인 Hidriv가 홍콩 증권거래소 상장을 다시 신청했습니다. 이 회사는 누적 304대의 자율 주행 광산 트럭을 인도했으며, 2024년 매출은 4억 1,000만 위안(RMB)을 기록했으나 여전히 5억 8,000만 위안(RMB)의 손실을 보고 있습니다.
· 중국의 민첩한 손(dexterous-hand) 촉각 센서가 변곡점에 도달하고 있습니다. PaXini의 PX-Cloud V3는 **단가 2,000 위안(RMB) 미만으로 32×32 어레이(array)**를 구현했으며, AgiBot의 Lingxi Pro에 통합된 후 정밀 조작(fine-manipulation) 성공률이 95.3%로 상승했습니다.
I. 연구 진행 상황
EPIC-Contact: 민첩한 손을 위한 실제 "손-물체 접촉 기하학(Hand-Object Contact Geometry)" 채우기 · 인지(perception)
민첩한 손(Dexterous-hand) 연구는 "보기 좋은 파지 포즈(grasp poses) 생성"에서 "실제 접촉(real contact) 모델링"으로 이동하고 있습니다. 이 연구는 바로 그 근본적인 격차를 목표로 합니다. 1인칭(egocentric) 시점에서는 손과 물체가 서로를 빈번하게 가리기(occlude) 때문에, 모델이 손의 포즈를 추정하더라도 실제로 접촉이 어디에서 발생하는지, 또는 파지가 어떻게 안정적으로 유지되는지를 알 수 없습니다. 저자들은 EPIC-Contact 데이터셋(2.3K개의 야생(in-the-wild) 1인칭 클립, 62.3K 프레임)을 공개하여 밀집된 양방향 3D 손-물체 접촉 대응 관계(correspondences)를 제공하며, HOPformer를 사용하여 단일 순전파(forward pass) 과정에서 손과 물체의 포즈를 공동으로 예측합니다. 이 모델은 ARCTIC 데이터셋에서 82.4%를 달성하며(SOTA 대비 6.2포인트 높음), EPIC-Contact에서는 성공률을 거의 두 배로 높이는 동시에 접촉 편차(contact deviation)를 75% 줄였습니다. 이는 1인칭 시점, 인간의 손-물체 접촉 기하학(contact geometry), 그리고 전이 가능한 포즈 추정(pose estimation)을 하나의 데이터 루프(data loop)로 통합하여, 파지(grasping) 및 다지(multi-finger) 제어의 한계를 직접적으로 높여줍니다.
분석: Embodied AI Intelligence Officer 출처 (WeChat, CN)
DCGrasp: "거리 프로필(Distance Profiles)"을 통한 제어 가능한 교차 손 형태학(Cross-Hand-Morphology) 파지 생성 · 조작(manipulation)
3D 손-물체 상호작용 생성을 목표로 하는 이 연구는 거리 프로필(Distance Profile)(각 손 정점(vertex)에서 가장 가까운 물체 지점까지의 부호 있는 거리)을 제안합니다. 디퓨전 트랜스포머(Diffusion Transformer)가 먼저 거리 프로필과 후보 손 포즈를 생성한 다음, 최적화 단계를 통해 손 포즈가 근접 접촉 기하학(near-contact geometry)과 일치하도록 보장합니다. 이를 통해 물리적으로 타당하고 사용자가 제어 가능하며, 다양한 물체와 **손 규모의 형태학(hand-scale morphologies)**에 걸쳐 일반화되는 파지를 생성합니다. 이는 민첩한 손 제어를 "관절 각도를 직접 회귀(regressing)하는 것"에서 "접촉 기하학을 명시적으로 제약하는 것"으로 격상시킵니다.
Hiroyasu Akada 외 · 분석: Embodied AI Intelligence Officer 출처 (WeChat, CN)
Graspability Field: "밀기, 툭 치기, 굴리기"를 파지(Grasping)를 향한 전조 행동으로 전환하기 · manipulation
실제로 물체는 처음부터 항상 파지 가능한 포즈(pose)로 놓여 있지 않습니다. 로봇은 먼저 물체를 파지 가능한 상태로 이동시켜야 합니다. 이 연구는 목표 포즈를 미리 설정하는 대신, 합성된 파지(grasp)로부터 파지 가능한 집합을 구축하고 **graspability field(파지 가능성 필드)**를 학습하여, 연속적인 파지 가능성 신호를 사용해 강화학습 (RL) 정책을 가이드합니다. 시뮬레이션과 실제 하드웨어 모두에서, 외부 플래너(planner)나 수동으로 정의된 정지 조건 없이도 물체를 파지 가능한 상태로 조정하는 폐루프(close the loop) 제어가 가능합니다.
Licheng Zhong, Gim Hee Lee (NUS) · 분석: Embodied AI Intelligence Officer 출처 (WeChat, CN)
오늘의 다른 논문들: TacEvo — LLM을 사용하여 구조적 변이를 생성하고 MAP-Elites 품질-다양성(quality-diversity) 탐색을 결합하여 촉각 센싱 네트워크를 자동으로 설계하며, 96%의 신뢰할 수 있는 구조 생성 성능을 달성함; JointHOI — 동적 접촉 맵(contact maps)을 내부 제약 조건으로 취급하는 단일 단계 확산 모델(single-stage diffusion model)로, 손-물체 상호작용 생성의 물리적 타당성을 개선하고 상호 침투 및 공중 부양 아티팩트(artifacts)를 제거함; AR 원격 조작 데모 + 대조 강화학습 (contrastive reinforcement learning)을 이용한 숙련된 파지 — 단 15개의 전문가 궤적(trajectories)만으로 병 파지(bottle-grasping) 성공률을 91.83%까지 끌어올리고 수렴 시간을 270분에서 55분으로 단축함 (arXiv 2602.07341 출처).
오픈 소스 · 도구 · 벤치마크
· unitree_lerobot: LeRobot 프레임워크를 기반으로 제작되었으며 하드웨어 — 구체화 데이터 (embodiment data) — 모방 학습 (imitation learning) 파이프라인을 연결하는 Unitree의 G1 양팔 정교한 손 (dexterous-hand) 휴머노이드용 학습 스택입니다. GitHub 스타 수는 약 708개입니다 출처 (WeChat, CN)
· GraspXL: 형태 적응 (morphology-adaptation) 및 접촉 사전 정보 (contact priors) 학습을 위해 MANO, Allegro, Shadow 및 기타 손 형태를 포함하여 500,000개 이상의 객체에 대한 파지 동작 시퀀스를 제공하는 개방형 교차 손 형태 (cross-hand-morphology) 파지 데이터셋입니다 출처 (WeChat, CN)
· UniDex (CVPR 2026): 1인칭 시점 (egocentric) 인간 영상을 통해 범용 정교한 손 제어 (dexterous-hand control)를 학습하며, EPIC-Contact와 함께 "1인칭 시점 인간 영상"이 정교한 손 정책 (dexterous-hand policies)을 위한 핵심 데이터 자산이 되고 있음을 확인시켜 줍니다 출처 (WeChat, CN)
· 세계 모델 벤치마크 (World model benchmarks): 비디오 생성, 구체화된 AI (embodied AI), 자율 주행 분야가 통일된 측정 방식 없이 각자 "세계 모델 (world models)"을 구축한다고 주장하며 발생하는 혼란에 대응하여, WorldModelBench, WorldScore, WorldLens 등 새로운 벤치마크들이 잇따라 출시되었습니다 출처 (WeChat, CN)
II. 금융 및 거래 (Financing & Deals)
Hidriv (希迪智驾) | 홍콩 증권거래소 메인보드 상장 신청 | CICC, CSC, Ping An 공동 스폰서 · 자율주행 (autonomy)
폐쇄된 환경에서의 자율주행 (autonomous driving)에 집중하고 있는 Hidriv가 자율주행 광산 및 물류 차량과 V2X 차량-도로 협력 기술을 전문으로 하며 홍콩 증권거래소(Hong Kong Stock Exchange) 상장을 위해 다시 한번 신청서를 제출했습니다. 2025년 중반 기준으로, 이 회사는 누적 304대의 자율주행 광산 트럭과 110대의 독립형 트럭 시스템을 인도했으며, 추가로 357대의 광산 트럭에 대한 지표적 주문(indicative orders)을 확보했습니다. 2024년 제품 판매 매출 기준, 이 회사는 중국의 자율주행 광산 트럭 솔루션 시장에서 1위를 차지하고 있으며, 세계 최대 규모의 자율주행 및 수동 운전 광산 차량 혼합 함대(mixed fleet)를 배치했습니다. 재무적으로는 여전히 투자 단계에 머물러 있습니다. 2024년 매출은 RMB 4억 1,000만 위안이며 매출총이익률 (gross margin)은 24.7%였으나, 해당 연도에 5억 8,100만 위안의 손실을 기록했습니다. 출처: Sina Finance source
Vita Dynamics (Vbot) | Pre-A 라운드 | Yuanjing Capital 참여 · 로봇 (embodied)
사족 보행 로봇 기업인 Vita Dynamics가 Yuanjing Capital의 참여와 함께 Pre-A 투자 라운드를 완료했습니다. 이 회사는 자사의 "슈퍼 로봇 개(Super Robot Dog)"가 데모 유닛에서 실제 출하로 넘어가 **양산 인도 (mass-production delivery)**를 시작했다고 밝혔습니다. 이는 사족 보행 플랫폼 경쟁에서 보기 드문 양산 이정표입니다. 출처: Yuanjing family source
UBTECH | H주 전량 유통을 위한 CSRC 신고 · 휴머노이드 (humanoid)
UBTECH, 홍콩 증시에 상장된 휴머노이드 로봇 회사인 UBTECH가 중국증권감독관리위원회(CSRC)로부터 자사 H주 전량 유통과 관련하여 신고 통지서를 받았습니다. 이를 통해 국내 주주들의 주식을 거래 가능한 H주로 전환할 수 있게 되어, 홍콩에서 회사의 자금 조달 및 유동성 채널을 더욱 열게 될 것입니다. 출처: Ifeng source
시장 동향 | 중국의 체화된 AI(Embodied AI) 자금 조달 규모, 상반기 기준 약 935억 위안 달성 · 휴머노이드 ⚠️ 통계 방법론 상이
상반기 활동을 검토한 여러 기관에 따르면, 중국의 체화된 AI 분야에서 총 자금 조달액은 약 **935억 위안(RMB)**에 달했으며, 6월 한 달 동안만 약 322건의 거래가 있었습니다. 이 중 전 스택(full-stack) 휴머노이드 기업들이 가장 많은 자본을 끌어모았습니다. 이는 최근 AgiBot (Zhiyuan)과 Zhiping Fang (智平方) 같은 기업이 각각 200억 위안 규모의 가치를 인정받으며 이루어진 자금 조달 물결을 이어가고 있습니다. 하지만 이러한 자금을 유치한 회사들의 매출이나 수주 잔고는 일반적으로 수백억 위안 단위의 가치를 뒷받침하기에는 크게 부족하며, 현재 투입되는 자본 대부분은
CATL과 로봇 기업 Galbot은 글로벌 전략적 파트너십을 체결했습니다. 이번 협력의 핵심은 Galbot의 고하중 휴머노이드 로봇(humanoid robot)인 Galbot S1이 현재 CATL의 스마트 생산 라인에서 일상적으로 운용되고 있다는 점입니다. 양사에 따르면, S1은 50kg의 양팔 가용 하중(dual-arm payload), 센서리스(vision-only) 기반의 센티미터 수준 위치 측정(localization), 그리고 360° 전방위 장애물 회피 기능을 갖추고 있습니다. CATL의 배터리 셀(cell failure rate가 ppb(parts-per-billion) 수준에 달한다고 주장됨)과 결합하여, 1회 충전 시 약 8시간 동안 연속 가동이 가능하며, 모듈 및 배터리 팩 제조 공정에 배치되어 자재 운반(material handling) 및 픽 앤 플레이스(pick-and-place)와 같은 고강도 작업을 직접 대체하고 있습니다. 또한 이번 파트너십은 전력 배터리의 점검, 유지보수 및 재활용을 담당하는 CATL의 '닝지아 서비스(Ningjia Service)' 네트워크를 휴머노이드 로봇까지 확장하며, 양사는 세계 최초의 휴머노이드 로봇 사후 서비스(after-sales service) 표준을 공동 구축할 것이라고 밝혔습니다. 3C 품질 검사 및 자동차 생산 라인의 이전 사례들에 이어, 이번 건은 제조 분야의 선두 기업이 자체 사용 사례(use case)를 활용해 휴머노이드 도입을 주도하는 동시에 핵심 부품 공급망을 확보하는 또 다른 사례입니다. 이번에는 배터리, 배치 시나리오, 사후 서비스까지 한꺼번에 뒷받침하고 있습니다. 출처: Markets Insider source
WeRide × Grab: 싱가포르 최초의 공개 로보택시(robotaxi) 운영 · 자율주행 (autonomy)
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기