arXiv논문2026. 05. 07. 13:01

협업 로봇 군집을 위한 모듈형 강화학습

요약

본 논문은 공통 목표를 공유하지만 상호작용 범위가 제한적인 협업 로봇 군집을 위한 다중 에이전트 강화학습(MARL) 문제를 다룹니다. 기존의 접근 방식은 모든 가능한 조합적 상태를 표현해야 하므로 메모리 한계에 직면합니다. 이에 본 논문은 상태 공간 상호작용을 효율적으로 표현하기 위해 모듈형(분해된) 표현 방식을 제안하며, 각 특징을 독립적으로 학습하고 결과를 집계하여 이 문제를 해결하는 방법을 제시했습니다.

핵심 포인트

협업 로봇 군집은 공통 목표를 가지지만 개별 상호작용의 전체 유틸리티 파악이 어려운 환경입니다.
기존 MARL 방식은 모든 가능한 조합적 상태를 표현해야 하므로 메모리 및 계산 능력에 한계가 있습니다.
제안된 모듈형(분해된) 접근법은 상태 공간 상호작용을 여러 독립적인 특징으로 분해하여 학습 효율성을 높입니다.
이 방법론은 포식(foraging) 시뮬레이션 로봇 군집 실험을 통해 그 효용성이 입증되었습니다.

협업 로봇 군집 (cooperative robot swarm) 은 공통된 목표를 공유하는 계산 능력에 제한된 로봇들의 집단입니다. 각 로봇은 동료 중 작은 부분만 상호작용할 수 있으며, 이것이 전체 유틸리티에 미치는 영향을 알지 못합니다. 분산 다중 에이전트 강화학습의 최근 발전은 다른 로봇과 효과적으로 상호작용하는 방법을 학습할 수 있음을 보여주었습니다. 이는 각 로봇이 독립적으로 학습하더라도 공통된 목표와 일치하는 방식으로 상호작용할 수 있음을 의미합니다. 그러나 이는 각 로봇이 잠재적으로 조합적 수의 상호작용 상태를 표현해야 함을 요구하며, 이는 로봇의 메모리 능력을 도전합니다. 이 논문은 군집을 위한 다중 로봇 강화학습의 공간 상호작용 상태를 표현하기 위한 대안적인 접근법을 제안합니다. 모듈형 (분해된) 표현 방식이 사용되며, 상태의 각 특징은 별도의 학습 절차로 처리되고 결과가 집계됩니다. 우리는 포식 (foraging) 을 수행하는 시뮬레이션 로봇 군집과의 다양한 실험을 통해 이 접근법의 효용을 입증했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

협업 로봇 군집을 위한 모듈형 강화학습

요약

핵심 포인트

댓글