AGEL-Comp: 상호작용 에이전트에서의 구성적 일반화를 위한 신경상징적 프레임워크
요약
본 논문은 대형 언어 모델(LLM) 기반 에이전트의 한계점인 '구성적 일반화' 문제를 해결하기 위해 신경상징적 AI 아키텍처인 AGEL-Comp를 제안합니다. AGEL-Comp는 세계 모델로 방향성 하이퍼그래프 기반의 인과 프로그램 그래프(CPG)를 사용하고, 상호작용을 통해 새로운 지식을 합성하는 ILP 엔진, 그리고 LLM과 NTP가 결합된 추론 핵심부를 통합했습니다. 이 프레임워크는 추론-추상화 학습 사이클을 구현하여 에이전트가 명시적이고 구조화된 방식으로 세계를 이해하고 계획할 수 있게 합니다.
핵심 포인트
- LLM 기반 에이전트는 구성적 일반화에 취약하여 상호작용 환경에서 견고성이 부족하다는 문제를 해결하고자 함.
- AGEL-Comp는 신경상징적 접근 방식을 채택하여, 인과 지식(CPG), 논리적 추론(ILP), 그리고 LLM의 생성 능력을 결합함.
- 핵심 메커니즘은 '추론-추상화 학습 사이클'로, 에이전트가 계획을 세우고 상징적 세계 모델을 지속적으로 확장하며 신경 적응을 통해 지식을 정렬함.
- 제안된 프레임워크는 기존 LLM 기반 모델보다 구성적 일반화 시나리오에서 우수한 성능을 보였으며, 해석 가능하고 구조화된 이해를 제공하는 원칙적인 경로를 제시함.
대형 언어 모델 (LLM) 기반 에이전트는 구성적 일반화 (compositional generalization) 에서 체계적인 실패를 보이며, 이로 인해 상호작용 환경에서의 견고성이 제한됩니다. 본 연구는 에이전트의 행동을 기반으로 하여 이 과제를 해결하기 위해 설계된 신경상징적 (neuro-symbolic) AI 에이전트 아키텍처인 AGEL-Comp 를 소개합니다. AGEL-Comp 는 세 가지 핵심 혁신을 통합합니다: (1) 절차적 및 인과적 지식을 방향성 하이퍼그래프 (directed hypergraph) 로 표현하는 동적 원인 프로그램 그래프 (Causal Program Graph, CPG) 를 세계 모델로 활용; (2) 상호작용을 통해 상징적 지식을 기반으로 하여 경험적 피드백으로부터 새로운 호른 절 (Horn clauses) 을 합성하는 귀납 논리 프로그래밍 (Inductive Logic Programming, ILP) 엔진; (3) 대형 언어 모델 (LLM) 이 후보 하위 목표 (sub-goals) 집합을 제안하고 신경 정리 증명기 (Neural Theorem Prover, NTP) 가 이를 논리적 일관성을 위해 검증하는 하이브리드 추론 핵심부입니다. 이러한 구성 요소들은 추론-추상화 학습 사이클 (deduction-abduction learning cycle) 을 구현하여 에이전트가 계획을 추론하고 상징적 세계 모델을 추상적으로 확장하게 하며, 신경 적응 단계는 그 추론 엔진을 새로운 지식과 정렬되게 합니다. 우리는 AGEL 에이전트를 평가하기 위해 exttt{Retro Quest} 시뮬레이션 환경 내에서 구성적 일반화 시나리오를 탐구할 수 있는 평가 프로토콜을 제안합니다. 우리의 결과는 순수 LLM 기반 모델보다 우리의 AGEL 모델이 더 나은 성능을 명확히 나타냅니다. 본 프레임워크는 에이전트가 세계에 대한 명시적이고 해석 가능하며 구성적으로 구조화된 이해를 구축하는 원칙적인 경로를 제시합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기