LeCropFollow: 비정형 작물 재배지 내 주행을 위한 잠재 공간 계획 (Latent Space Planning)
요약
비정형 작물 재배지에서 농업 로봇의 주행 성능을 높이기 위해 잠재 공간 계획(Latent Space Planning)을 활용하는 LeCropFollow 프레임워크를 제안합니다. 기하학적 모델링 대신 학습된 잠재 표현을 사용하여 의미론적 문맥을 보존함으로써, 불규칙한 지형에서도 안정적인 주행이 가능합니다.
핵심 포인트
- 자기 지도 학습 기반의 의미론적 히트맵 추출기 활용
- TD-MPC2 플래너와 통합하여 잠재 매니폴드 내 궤적 최적화
- 시뮬레이션에서 물리 세계로의 제로샷 전이(Zero-shot transfer) 가능
- 식재 간격(Plantation gaps)에서 기존 방식 대비 높은 성능 입증
- 키포인트 기반 방식 대비 의미론적 실패 2.4배 감소
불규칙한 식재나 불연속성과 같은 비정형 주행 특징(Unstructured navigational features)은 캐노피 하부(under-canopy) 농업 로봇의 주요 실패 원인으로 남아 있습니다. 기존의 기하학적 접근 방식은 고차원 시각 데이터를 결정론적 공간 참조(deterministic spatial references)로 압축하기 때문에, 모호한 지형을 주행하는 데 필요한 불확실성과 의미론적 문맥(semantic context)을 효과적으로 버리게 되어 이러한 시나리오에서 실패하는 경우가 많습니다. 이를 해결하기 위해, 우리는 명시적인 기하학적 모델링을 우회하여 학습된 잠재 표현(latent representation)을 사용하는 시각 주행 프레임워크인 LeCropFollow를 제시합니다. 자기 지도 학습 기반의 의미론적 히트맵 추출기(self-supervised semantic heatmap extractor)를 TD-MPC2(모델 기반 강화학습 (Model-Based Reinforcement Learning, MBRL) 플래너)와 통합함으로써, 우리 시스템은 잠재 매니폴드(latent manifold) 내에서 직접 궤적을 최적화합니다. 이 프레임워크는 압축되지 않은 히트맵 신호 위에서 작동하여, 기하학적 축소 과정에서 손실되는 의미론적 문맥을 보존합니다. 우리는 이러한 표현 방식의 전환이 미세 조정(fine-tuning) 없이 단순화된 시뮬레이션에서 물리적 세계로의 제로샷 전이(zero-shot transfer)를 가능하게 함을 입증합니다. 성장 후기 옥수수밭에서의 광범위한 현장 실험 결과, LeCropFollow는 비정형 열(unstructured rows)에서는 최신 베이스라인(state-of-the-art baselines)과 대등한 성능을 보였으나, 식재 간격(plantation gaps)에서는 이를 크게 능가하며 키포인트 기반 방식(keypoint-based methods) 대비 의미론적 실패를 2.4배 감소시켰습니다. 이러한 결과는 잠재 계획(latent planning)이 이질적인 농업 환경에서의 작업을 위해 기하학적 추정(geometric estimation)을 대체할 수 있는 강력한 대안임을 시사합니다. 코드, 모델 및 데이터는 다음에서 확인할 수 있습니다: https://felipe-tommaselli.github.io/lecropfollow .
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기