리만 기하학적 특징과 RNN 을 활용한 고차원 손가락 운동 디코딩
요약
본 논문은 근전도(EMG) 신호를 활용하여 고차원 손가락 운동학을 연속적으로 추정하는 엔드투엔드 프레임워크를 제시합니다. 기존의 분류 기반 방식이 가진 자유도 제한 문제를 해결하기 위해, 연구진은 8채널 EMG와 손가락 관절 각도를 포함한 대규모 데이터셋(EMG-FK)을 구축했습니다. 핵심 모델인 Temporal Riemannian Regressor (TRR)는 리만 기하학적 특징과 GRU를 결합하여 운동 디코딩의 정확도와 실시간성을 모두 높였으며, 이는 임베디드 시스템에서의 자연스러운 제어 구현 가능성을 입증합니다.
핵심 포인트
- EMG 기반 고차원 손가락 운동 추정을 위한 엔드투엔드 프레임워크를 제시함.
- 8채널 EMG 및 15개 관절 각도를 포함하는 대규모 동기화 데이터셋(EMG-FK)을 구축하여 모델 학습에 활용함.
- 리만 기하학적 특징과 GRU를 결합한 Temporal Riemannian Regressor (TRR) 모델을 개발하여 최첨단 성능을 달성함.
- TRR은 높은 정확도와 더불어 초당 10회 예측 속도로 작동하는 실시간성을 입증하며, Raspberry Pi 5에서의 배포 가능성을 보여줌.
팔뚝 표면 근전도 (EMG) 를 통한 고차원 손가락 운동학의 연속적 추정은 인공 팔, AR/XR 인터페이스 및 원격 조작을 위한 자연스러운 제어를 가능하게 할 수 있습니다. 그러나 인간 손 제스처의 복잡성과 팔뚝 근육들의 얽힘으로 인해 정확한 인식은 본질적으로 어려운 과제를 안고 있습니다. 기존 접근법은 분류 기반 기계 학습에 의존하여 작업 복잡성을 줄이는 방식으로, 제어 가능한 자유도를 제한하고 자연스러운 상호작용을 희생시킵니다. 우리는 소비자 급 하드웨어만 사용하여 EMG 에서 운동학으로의 연속적 회귀를 위한 엔드투엔드 프레임워크를 제시합니다. 이 프레임워크는 8 채널 EMG 팔밴드, 단일 웹캠 및 자동 동기화 절차를 결합하여, 풍부한 제약 없는 오른손 운동을 수행한 20 명의 참가자로부터 수집된 동기화된 EMG 와 15 개의 손가락 관절 각도를 포함한 10 시간 분량의 EMG-Finger-Kinematics 데이터셋 (EMG-FK) 을 구축할 수 있게 합니다. 우리는 또한 다중 밴드 리만 공분산 특징의 시퀀스를 사용하여 손가락 운동을 디코딩하는 경량 GRU 기반 모델인 Temporal Riemannian Regressor(TRR) 를 소개합니다. EMG-FK 와 공개 emg2pose 벤치마크 전반에 걸쳐, TRR 은 피험자 내 (intra-subject) 및 피험자 간 (cross-subject) 평가 모두에서 최첨단 방법을 능가합니다. EMG-FK 에서, TRR 은 피험자 내 평가에서 평균 절대 오차 $9.79 °\ ext{pm} 1.48$, 피험자 간 평가에서 $16.71 °\ ext{pm} 3.97$ 를 달성합니다. 마지막으로, 우리는 Raspberry Pi 5 에서의 실시간 배포와 로봇 손의 직관적 제어를 입증했습니다. TRR 은 초당 약 10 회 예측 속도로 작동하며, 최첨단 접근법보다 대략 10 배 더 빠릅니다. 이러한 기여들은 고차원 손가락 운동의 재현 가능한, 실시간 EMG 기반 디코딩에 대한 장벽을 낮추고, 임베디드 EMG 기반 시스템의 보다 자연스럽고 직관적인 제어를 위한 길을 열어줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기