다중 모달 불확실성 하에서 견고한 민첩한 잡기 수행을 위한 변분 신경 신뢰 파라미터화
요약
본 논문은 접촉 변동성 및 센싱 불확실성이 존재하는 환경에서 견고한 잡기(grasping) 수행을 위한 새로운 접근 방식을 제안합니다. 기존 방법들이 가진 확장성 문제와 높은 계산 비용 문제를 해결하기 위해, 잡기 획득 과정을 잠재 접촉 파라미터와 물체 자세에 대한 변분 추론으로 공식화하고 신뢰를 미분 가능한 가우시안 혼합으로 표현했습니다. 이를 통해 꼬리 견고성을 직접 최적화할 수 있는 경로상 경사(pathwise gradients) 기반의 CVaR 대체기를 구현하여, 기존 모델 예측 제어 방식 대비 더 높은 성능과 빠른 계산 속도를 달성했음을 시뮬레이션 및 실험을 통해 입증했습니다.
핵심 포인트
- 변분 신경 신뢰를 사용하여 잡기 획득 과정을 잠재 접촉 파라미터와 물체 자세에 대한 변분 추론으로 공식화함.
- 신뢰를 미분 가능한 가우시안 혼합(Gaussian Mixture)으로 표현하여, 꼬리 견고성을 직접 최적화할 수 있는 경로상 경사 기반의 CVaR 대체기를 구현함.
- 제안된 방법은 접촉 불확실성 및 외생적 힘 교란 하에서 기존 모델 예측 제어 방식보다 더 높은 잡기 성공률과 빠른 계획 시간을 보여줌.
- 다중 손가락 로봇 암 실험을 통해 물체 자세 불확실성 하에서의 잡기 및 들어 올리기 성능이 검증되었으며, 낮은 보정 오차를 달성함.
접촉 변동성, 센싱 불확실성 및 외부 교란으로 인해 잡기 실행은 확률적입니다. 기대 품질 목표는 꼬리(outcome) 결과를 간과하며, 종종 악조건의 접촉 실현 하에서 실패하는 잡기를 선택합니다. 위험 민감성 POMDPs 는 이러한 실패 모드를 해결하지만, 많은 경우 입자 필터(particle-filter) 신뢰를 사용하여 확장성이 낮고 경사 기반 최적화를 방해하며, 고분산 근사로 조건부 가치-at-위험(CVaR)을 추정합니다. 우리는 대신 잡기 획득을 잠재 접촉 파라미터와 물체 자세에 대한 변분 추론으로 공식화하여, 신뢰를 미분 가능한 가우시안 혼합으로 표현합니다. 우리는 Gumbel-Softmax 구성 요소 선택과 위치-스케일 재파라미터화를 사용하여 샘플을 신뢰 파라미터의 부드러운 함수로 표현하며, 이를 통해 꼬리 견고성을 직접 최적화하기 위한 미분 가능한 CVaR 대체기를 통한 경로상 경사(pathwise gradients)를 가능하게 합니다. 시뮬레이션에서 우리의 변분 신경 신뢰는 접촉 파라미터 불확실성과 외생적 힘 교란 하에서 견고한 잡기 성공을 개선하고, 입자 필터 모델 예측 제어에 비해 계획 시간을 약 한 배로 줄입니다. 다중 손가락 손을 가진 직렬 연쇄 로봇 암에서 우리는 가우시안 기준과 비교하여 물체 자세 불확실성 하에서의 잡기 및 들어 올리기 성공을 검증했습니다. 두 방법 모두 테스트된 교란에서 성공하지만, 우리의 제어기는 더 적은 단계와 더 짧은 실제 시간으로 종료하면서 더 높은 촉각 잡기 품질 대용치를 달성합니다. 우리가 학습한 신뢰는 또한 위험을 더 정확하게 보정하여, 테스트된 시뮬레이션 체제 전반에 걸쳐 평균 절대 보정 오차를 0.14 미만으로 유지하며, Cross-Entropy Method 플래너의 0.58 에 비해 우수합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기