본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 19. 10:49

연속적이고 일관된 로봇 동작 생성을 위한 주파수 인식 플로우 매칭 (Frequency-Aware Flow Matching)

요약

이 논문은 로봇 동작 생성 시 이질적인 제어 주파수 문제를 해결하기 위해 주파수 인식 플로우 매칭(FAFM)을 제안합니다. DCT를 활용해 동작을 주파수 영역에서 모델링하고 시간 미분 정규화를 통해 연속적이고 부드러운 동작을 구현합니다.

핵심 포인트

  • DCT를 이용해 이산 동작 시퀀스를 주파수 영역으로 변환하여 처리
  • 1차 시간 미분 정규화로 고주파 오류 억제 및 동작 부드러움 확보
  • 추가 파라미터 없이 기존 시각-언어 동작 모델에 즉시 적용 가능
  • 다양한 벤치마크와 실제 Franka 로봇에서 성공률 및 강건성 입증

플로우 매칭 (Flow matching)은 확산 정책 (diffusion policy)과 유사한 접근 방식과 더불어, 복잡하고 다중 모드적인 (multimodal) 동작 분포를 모델링하는 강력한 표현력 덕분에 로봇 조작 (robotic manipulation)을 위한 표준 패러다임으로 부상했습니다. 그러나 기존 방법들은 이산화된 동작 청크 (discretized action chunks)에 의존하기 때문에, 이질적인 제어 주파수 (heterogeneous control frequencies)에서 수집된 시연 데이터에 취약하며, 제어 안정성을 저해하는 시간적으로 일관되지 않은 동작을 생성하기 쉽습니다. 본 논문에서는 연속적이고 시간적으로 일관된 동작을 출력하는 주파수 인식 플로우 매칭 (Frequency-Aware Flow Matching, FAFM)을 제안합니다. 이질적인 주파수 입력을 처리하기 위해, 우리는 이산 코사인 변환 (discrete cosine transform, DCT)을 사용하여 이산 동작 시퀀스를 주파수 영역으로 변환하고, 결과로 나온 계수 (coefficients)들에 대해 플로우 매칭을 수행하며, 코사인 기저 확장 (cosine basis expansion)을 통해 연속적인 동작을 재구성합니다. 시간적으로 일관된 동작을 생성하기 위해, 우리는 부드러운 동작을 촉진하도록 1차 시간 미분 (first-order temporal derivative)을 정규화합니다. 이는 고주파 오류를 억제하고 급격한 동작 변화를 방지하는 소볼레프 유형의 제약 (Sobolev-type constraint)에 해당합니다. 우리의 FAFM은 단순하며, 추가적인 네트워크 파라미터를 도입하지 않고 독립적인 플로우 매칭 정책 및 시각-언어 동작 모델 (vision-language action models)에 적용 가능합니다. 합성 토이 벤치마크 (synthetic toy benchmark), 장애물 회피 (obstacle avoidance), LapGym, 그리고 LIBERO 전반에 걸쳐, FAFM은 성공률, 다중 모드 표현력 (multimodal expressivity), 동작의 부드러움 (motion smoothness), 수렴 속도, 기계적 편향 (mechanical bias) 및 혼합 주파수 입력에 대한 강건성을 향상시킵니다. 이러한 이점은 실제 Franka 로봇에 배포했을 때도 일관되게 나타납니다. 코드는 https://anonymous.4open.science/r/FAFM 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0