MOMO: 로봇 스킬 학습을 위한 통합 인터랙티브 프레임워크
요약
산업용 로봇이 다양한 환경과 작업에 유연하게 적응하려면 여러 상호작용 방식의 결합이 필요합니다. 본 논문은 이러한 요구를 충족하는 'MOMO'라는 통합 프레임워크를 제시합니다. MOMO는 물리적 접촉(Kinesthetic touch), 자연어 명령어(Natural language), 그래픽 웹 인터페이스(Graphical web interface) 세 가지 상호작용 양식을 결합하여 로봇 스킬을 학습하고 적응시킵니다. 특히, 이 프레임워크는 에너지 기반 인간 의도 감지, 안전한 언어 적응을 위한 도구 기반 LLM (Tool-based
핵심 포인트
- MOMO는 물리적 접촉, 자연어, 그래픽 인터페이스를 결합하여 로봇 스킬 학습의 유연성을 높입니다.
- LLM은 코드를 생성하는 대신 미리 정의된 함수를 선택하고 매개변수화하여 안전한 언어 적응을 지원합니다.
- 프레임워크는 KMPs와 같은 모션 인코딩부터 에르고딕 제어(ergodic control)까지 광범위하게 스킬 적응이 가능함을 입증했습니다.
산업용 로봇은 다양한 작업과 환경에 맞춰 유연하게 적응할 수 있어야 합니다. 기존 시스템의 한계를 극복하기 위해, 본 연구는 세 가지 상호 보완적인 모달리티를 결합한 'MOMO'라는 인터랙티브 프레임워크를 제안합니다.
이 프레임워크는 첫째, 정밀한 공간 수정을 위한 **물리적 접촉(Kinesthetic touch)**을 활용하며, 둘째, 고수준의 의미론적 변경을 위해 자연어 명령어를 사용합니다. 셋째, 웹 인터페이스를 통해 기하학적 관계 시각화, 매개변수 조정, 드래그앤드롭 방식의 경로 편집이 가능합니다.
MOMO는 다섯 가지 핵심 구성 요소로 이루어져 있습니다. 여기에는 에너지 기반 인간 의도 감지, 안전한 자연어 적응을 위한 도구 기반 LLM (Tool-based LLM) 아키텍처가 포함됩니다. 이 LLM은 코드를 직접 생성하기보다 미리 정의된 함수를 선택하고 매개변수화하는 방식을 사용합니다. 또한, 모션 인코딩을 위해 Kernelized Movement Primitives (KMPs)와 가이드 시연 기록을 위한 확률적 Virtual Fixtures가 적용되며, 표면 마감(surface finishing)에는 에르고딕 제어(ergodic control)를 활용합니다.
연구 결과, 이 도구 기반 LLM 아키텍처는 KMPs부터 에르고딕 제어까지 스킬 적응 범위를 일반화하며, 음성 명령만으로도 표면 마감 작업을 수행할 수 있음을 입증했습니다. 실제 Automatica 2025 무역 박람회에서 7-DoF 토크 제어 로봇을 이용한 검증은 MOMO의 산업 현장 적용 가능성을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기