미션 지시, 군집 실행: 웹 오브 드론에서의 에이전트 강화 LLM 추론
요약
본 논문은 사용자의 자연어 미션 목표를 받아 시스템이 자율적으로 실행하는 에이전트 강화 LLM 프레임워크를 제시하며, 이를 웹 오브 드론(Web of Drone) 환경에 적용했습니다. 이 프레임워크는 LLM 기반 에이전트 코어와 W3C WoT 표준을 결합하여 드론, 센서, 서비스를 표준화된 'Thing'으로 노출함으로써 코드 생성 없이도 구조화된 상호작용과 안전한 액추에이션을 가능하게 합니다. 실험 결과, 일반 목적 LLM만으로는 신뢰할 수 있는 군집 작업을 수행하기 어려우며, 미션 특화 계획 도구와 런타임 가드레일이 필수적임을 입증했습니다.
핵심 포인트
- LLMs를 사이버 물리 시스템(CPS)의 고수준 추론 엔진으로 활용하는 새로운 프레임워크를 제안함.
- W3C 웹 오브 씽(WoT) 표준을 기반으로 드론, 센서 등을 'Thing'으로 추상화하여 상호운용성을 확보함.
- 제안된 아키텍처는 코드 생성 없이도 구조화된 도구 사용 및 안전한 액추에이션을 가능하게 함.
- 실험 결과, LLM의 강력한 추론 능력만으로는 부족하며, 미션 특화 계획 도구와 런타임 가드레일이 시스템의 신뢰성과 견고성을 높이는 데 결정적임을 보여줌.
대형 언어 모델 (LLMs) 은 사이버 물리 시스템의 고수준 추론 엔진으로 점점 더 많이 탐구되고 있으나, 이질적인 인터페이스, 제한된 그라운드링 (grounding), 그리고 장기 실행이 필요한 폐쇄 루프 실행의 필요성 때문에 실시간 UAV 군집 관리에 적용하는 것은 여전히 도전과제입니다. 본 논문은 사용자가 자연어로 미션 목표를 명시하고 시스템이 그라운딩된 실시간 상호작용을 통해 이를 자율적으로 실행하는 에이전트 강화 LLM 프레임워크를 제시합니다. 제안된 아키텍처는 LLM 기반 에이전트 코어 (Agent Core), 모델 컨텍스트 프로토콜 (MCP) 게이트웨이, W3C 웹 오브 thing (WoT) 표준에 기반한 웹 오브 드론 추상화를 결합합니다. 드론, 센서, 서비스를 표준화된 WoT Thing으로 노출함으로써, 이 프레임워크는 코드 생성 없이도 구조화된 도구 기반 상호작용, 지속적인 상태 관측, 안전한 액추에이션을 가능하게 합니다. ArduPilot 기반 시뮬레이션을 사용하여 4 개의 군집 미션과 6 개 최신 LLM 을 활용하여 프레임워크를 평가했습니다. 결과는 강력한 추론 능력에도 불구하고, 명시적인 그라운드링 및 실행 지원 없이 작동할 때 현재 일반 목적형 LLM 이 단순한 군집 작업조차도 신뢰할 수 있는 실행을 달성하기 어렵다는 것을 보여줍니다. 미션 특화 계획 도구와 런타임 가드레일 (runtime guardrails) 은 견고성을 크게 향상시키며, 토큰 소비량만으로는 실행 품질이나 신뢰성을 나타내지 못함을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기