본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 11:38

TRACE: 지연된 증거 기반 시각-운동 모방을 위한 궤적 라우팅 인과 메모리

요약

지연된 증거가 존재하는 환경에서 로봇의 시각-운동 모방 성능을 높이기 위한 TRACE 프레임워크를 제안합니다. 경로 시그니처를 활용해 제한된 메모리에 핵심 증거를 저장하고 검색함으로써, 시각적으로 모호한 상황에서도 정확한 행동 결정을 내릴 수 있도록 돕습니다.

핵심 포인트

  • 지연된 증거 과제를 해결하기 위한 메모리 프레임워크 TRACE 소개
  • 경로 시그니처를 사용하여 궤적 조건부 키를 생성하고 메모리 인덱싱
  • 기존 정책 모델의 변경 없이 경량 어댑터 방식으로 부착 가능
  • 장기 조작 과제에서 기존 순환 메모리 모델 대비 높은 성공률 달성

자율 운영 중인 로봇은 더 이상 보이지 않는 증거를 바탕으로 결정을 내려야 할 수도 있습니다. 우리는 초기 단서가 나중의 결정 시점 이전에 사라져서, 시각적으로 유사한 관측치라도 서로 다른 행동을 요구할 수 있는 extit{지연된 증거 (delayed-evidence)} 과제를 연구합니다. 이러한 환경에서는 현재의 관측치만으로는 제어를 위한 충분한 상태(state)가 되지 않습니다. 우리는 시각-운동 모방 (visuomotor imitation) 정책을 위한 메모리 프레임워크인 TRAjectory-routed Causal Evidence (TRACE)를 소개합니다. TRACE는 객체의 정체성, 목표 선택 또는 경로 의존적 상태와 같이 작업과 관련된 시각적 및 로봇 상태 증거를 긴 에피소드 동안 제한된 크기로 유지되는 고정 크기의 잠재 메모리 (latent memory)에 저장합니다. TRACE는 메모리를 원시 시간(raw time)이나 수동으로 제공된 작업 레이블로 인덱싱하는 대신, 실행된 로봇 상태 궤적의 조밀하고 순서에 민감한 특징인 extit{경로 시그니처 (path signatures)}를 사용합니다. 이러한 시그니처는 시각적 단서 자체를 저장하는 것이 아니라, 단서가 보였을 때 저장된 증거를 쓰고 검색하기 위한 궤적 조건부 키 (trajectory-conditioned keys)를 제공합니다. 로봇이 나중에 모호한 관측치에 도달하면, 정책은 TRACE 메모리를 조건화하여 누락된 문맥을 복구하고 올바른 분기(branch)를 선택합니다. TRACE는 정책의 백본 (backbone), 액션 헤드 (action head) 또는 모방 목적 함수를 변경하지 않고 경량 어댑터 (lightweight adapters)를 통해 정책에 부착됩니다. 시각적으로 모호한 분기점이 존재하는 실제 환경의 장기 조작 (long-horizon manipulation) 과제 전반에서, TRACE는 짧은 이력 (short-history) 및 순환 메모리 (recurrent memory)를 포함한 대안적인 베이스라인 모델들에 비해 분기 선택 및 작업 성공률을 향상시킵니다. 프로젝트 페이지: https://jeong-zju.github.io/trace

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0