다중 로터 항공 로봇을 위한 체형 조건부 범용 제어
요약
다양한 로터 구성을 가진 다중 로터 항공 로봇을 제어할 수 있는 범용 위치 제어 정책을 제안합니다. 물리 기반의 체형 기술자를 조건으로 사용하여 단일 네트워크로 임의의 형태를 제어하며, 시뮬레이션에서 실세계로의 제로샷 전이를 입증했습니다.
핵심 포인트
- 체형 기술자를 활용한 범용 위치 제어 정책 제시
- PPO 알고리즘과 NVIDIA Warp 기반 시뮬레이터 사용
- 비대칭 및 비평면 시스템을 포함한 임의의 구성 지원
- 실제 헥사로터 시스템에서 제로샷 전이 성공
우리는 단일 네트워크 가중치 세트로 특정 로터 수를 가진 임의의 다중 로터 (multirotor) 구성을 제어할 수 있는 범용 위치 제어 정책 (position control policy)을 제시합니다. 이 정책은 물리 기반의 체형 기술자 (embodiment descriptor)를 조건으로 합니다. 즉, 질량 정규화된 모터 추력이 바디 프레임 (body-frame)에서 선가속도 및 각가속도를 어떻게 생성하는지를 포착하는, 질량 및 관성 정규화된 제어 할당 행렬 (control allocation matrix)을 사용합니다. 정책을 학습시키기 위해, 우리는 비평면 (non-planar) 및 비대칭 (asymmetric) 시스템을 포함하여 광범위한 임의의 다중 로터 구성 분포에서 샘플링하며, 근사 정책 최적화 (Proximal Policy Optimization, PPO)를 사용하여 단일하고 컴팩트한 네트워크를 최적화합니다. 학습에는 NVIDIA Warp 기반의 맞춤형 동역학 시뮬레이터 (dynamics simulator)를 사용하여 RTX 3090 GPU에서 단 5분만이 소요됩니다. 광범위한 시뮬레이션 실험을 통해, 우리는 체형 조건화 (embodiment conditioning)가 임의의 형태 (morphologies)에 걸쳐 견고한 범용 제어를 가능하게 함을 보여줍니다. 우리는 평면 로봇, 부분적으로 대칭인 비평면 시스템, 그리고 무작위의 비대칭 비평면 구성을 포함한 세 가지 다양한 헥사로터 (hexarotor) 시스템에서 이 범용 정책의 제로샷 (zero-shot) 실세계 전이를 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기