검색이 메모리가 될 때: 로봇 설계 실험을 전이 가능한 기술로 전환하기
요약
Auto-Robotist는 로봇 설계 과정에서 발생하는 형태 탐색 흔적을 자연어 기술 라이브러리로 증류하는 자가 진화형 LLM 에이전트입니다. 설계 지식을 명시적인 라이브러리로 저장하여 검색 및 재사용이 가능하게 함으로써, 기존 유전 알고리즘보다 뛰어난 설계 전이 성능을 보여줍니다.
핵심 포인트
- 설계 지식을 자연어 기술 라이브러리로 변환하여 저장
- 검사 가능한 형태의 설계 메모리 구축
- 콜드 스타트 검색 성능 5배 개선
- 학습된 기술을 새로운 설계 공간으로 10배 전이 가능
- 유전 알고리즘(GA)을 능가하는 참조 조건부 전이 성능
대규모 언어 모델 (LLMs)은 진화적 로봇 설계 (evolutionary robot design)를 위한 제안 생성기 (proposal generators)로 점점 더 많이 사용되고 있지만, 대부분의 루프는 메모리가 없는 (memoryless) 상태로 남아 있습니다. 즉, 시뮬레이터 결과가 다음 세대의 개체군 (population)을 형성하기는 하지만, 재사용 가능한 설계 지식으로 보존되지는 않습니다. 우리는 형태 탐색 (morphology-search) 흔적을 명시적인 자연어 기술 라이브러리 (skill library)로 증류하는 자가 진화형 LLM 에이전트인 Auto-Robotist를 제시합니다. 각 기술은 구조적 원형 (structural archetype), 증거에 기반한 긍정적 및 부정적 규칙, 그리고 이를 뒷받침하는 평가된 설계들을 저장하여, 설계 메모리가 개체군 내에 암시적으로 존재하는 대신 검사 가능한 형태로 존재하게 합니다. 탐색 과정에서 에이전트는 기술을 검색하여 우수한 신체 (elite bodies)에 대한 LLM 편집을 조건화하는 동시에, 탐색을 위한 유전 알고리즘 (Genetic Algorithm (GA)) 변이 경로를 유지합니다. 평가 후에는 추가 (Add), 진단 (Diagnose), 병합 (Merge)을 통해 라이브러리를 업데이트합니다. 이동 (locomotion), 횡단 (traversal), 물체 상호작용 (object interaction)을 아우르는 7가지 EvoGym 태스크에 걸쳐, Auto-Robotist는 콜드 스타트 (cold-start) 5x5 검색을 5배 개선하고 학습된 기술을 10x10 설계 공간으로 전이하며, 여기서 참조 조건부 전이 (reference-conditioned transfer)는 모든 태스크에서 GA를 능가합니다. 이러한 결과는 LLM 에이전트가 비용이 많이 드는 물리적 평가를 재사용 가능하고 감사 가능한 (auditable) 설계 원칙으로 변환할 수 있음을 시사합니다. 우리의 코드는 승인 시 공개될 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기