Fourier Features를 이용해 에이전트가 높은 정밀도의 정책을 모방 학습으로 습득하게 하다
요약
본 논문은 로봇 조작의 높은 정밀도를 위해 포인트 클라우드 기반 모방 학습에 Fourier features를 적용하는 방법을 제안합니다. 이 방법은 3D 정보를 직교 좌표 공간에서 고차원 Fourier 공간으로 매핑하여, 신경망이 놓치기 쉬운 높은 주파수 특징을 효과적으로 추출할 수 있게 합니다.
핵심 포인트
- Fourier features는 포인트 클라우드 기반 모방 학습에 적용됩니다.
- 직교 좌표계 대신 고주파수 특징 접근성을 높여 성능을 개선합니다.
- RoboCasa 및 ManiSkill3 벤치마크에서 우수한 성능을 입증했습니다.
- 범용적인 도구로서 기하학적 세부 사항 활용 능력이 뛰어납니다.
높은 정밀도의 로봇 조작(robotic manipulation)에는 깊이의 모호성(depth ambiguity)과 원근 스케일 문제 때문에 RGB만으로는 달성하기 어려운 미세한 공간 추론 능력이 요구됩니다. 포인트 클라우드 기반 등 3D 정보를 직접 활용하는 정책들은 순수 이미지 기반 정책보다 더 강력한 기하학적 사전 지식(geometric prior)을 제공하지만, 그 성능은 여전히 작업에 따라 크게 달라집니다. 우리는 이러한 불일치가 신경망이 저주파 함수를 학습하는 경향인 스펙트럼 편향(spectral bias) 때문일 수 있으며, 이는 특히 느리게 움직이는 직교 좌표계 특징(Cartesian features)에 조건화된 아키텍처에 영향을 미친다고 가정합니다. 따라서 우리는 포인트 클라우드를 직교 좌표 공간에서 고차원 Fourier 공간으로 매핑하는 방법을 제안하며, 이를 통해 포인트 클라우드 인코더가 높은 주파수 특징(high-frequency features)에 직접 접근할 수 있도록 효과적으로 만듭니다. 우리는 RoboCasa 및 ManiSkill3 벤치마크의 까다로운 조작 작업과 실제 로봇 설정에서 Fourier features 사용을 실험적으로 검증했습니다. 단순함에도 불구하고, Fourier features가 다양한 인코더 아키텍처와 벤치마크 전반에 걸쳐 상당한 이점을 제공하며 하이퍼파라미터에 강건하다는 것을 발견했습니다. 우리의 결과는 Fourier features가 포인트 클라우드 기반 모방 학습을 위한 범용 도구로서의 잠재력을 보여주며, 직교 좌표계 특징보다 기하학적 세부 사항을 더 효과적으로 활용할 수 있게 한다는 것을 나타냅니다. 소스 코드와 비디오는 저희 프로젝트 페이지 https://fourier-il.github.io/fourier-il에서 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기