R-APS: 반사적 적대적 파레토 탐색(Reflective Adversarial Pareto Search)을 통한 제약 조건 기반 설계를 위한
요약
LLM 에이전트의 신뢰성 문제를 해결하기 위해 추론 모드 분해를 활용한 R-APS 방법론을 제안합니다. 미세 조정 없이 구조화된 프로토콜만으로 강건성과 효율성을 동시에 높여 로보틱스 설계 분야에서 뛰어난 성능을 입증했습니다.
핵심 포인트
- R-APS는 추론 모드 분해를 통해 에이전트의 구조적 실패를 해결함
- 미세 조정 없이 동결된 LLM 상에서 구조적 프로토콜로 작동함
- 로보틱스 설계에서 강건성 인증 및 반복 속도를 크게 향상시킴
- 구조화된 프로토콜이 모델 규모의 차이를 상쇄할 수 있음을 증명함
대규모 언어 모델(Large Language Models, LLMs)은 개방형 작업(open-ended tasks)에서는 유창하지만, 시스템이 계획을 세우고, 도구를 사용하며, 장기적인 지평(extended horizons)에 걸쳐 행동해야 하는 에이전트 설정(agentic settings)에서는 그 유창함이 신뢰할 수 있는 결과 전달을 보장하지 않습니다. 우리는 이러한 격차의 원인을 세 가지 결합된 구조적 실패로 추적합니다: 오류가 국소화(localization) 없이 전파되고, 최악의 상황에 대한 섭동(worst-case perturbations)이 평가되지 않으며, 축적된 지식이 결코 무효화되지 않는다는 점입니다. 우리는 이러한 문제들이 공통된 근본 원인을 공유한다고 주장합니다. 즉, 가추적(abductive), 반사실적(counterfactual), 메타 귀납적(meta-inductive), 교정적(corrective), 그리고 귀납적(inductive) 추론이 공유된 컨텍스트(context)를 서로 호환되지 않는 방향으로 끌어당긴다는 것입니다.
우리는 추론 모드 분해(reasoning-mode decomposition)를 통해 이 세 가지 실패를 모두 공동으로 해결하는 최초의 방법론인 R-APS(Reflective Adversarial Pareto Search)를 소개합니다. R-APS는 각 추론 모드에 고유한 컨텍스트를 할당하고 세 가지 시간 척도(timescales)에 걸쳐 상호작용을 조율합니다: 타입화된 검증 비평가(typed validation critic)를 통한 단계별 구성적 추론(실패 국소화), 일급 파레토 목적 함수(first-class Pareto objective)로서의 민감도 가이드 반사실적 스트레스 테스트(강건성), 그리고 명시적 무효화를 포함한 메타 귀납적 규칙 추출(지속적 메모리)입니다. R-APS는 미세 조정(fine-tuning)을 필요로 하지 않으며, 순수하게 구조화된 프로토콜 설계(structured protocol design)를 통해 동결된(frozen) LLM 상에서 작동합니다.
우리는 평면 메커니즘 합성(planar mechanism synthesis; 로보틱스, 의수, 기계 설계) 분야에서 평가를 수행하였으며, 모든 후보는 운동학 솔버(kinematic solver)에 의해 검증되었습니다. 32개의 대상 궤적(target trajectories)에 대해, R-APS는 막대 개수(bar-count)와 최악의 상황 강건성(worst-case robustness)을 동시에 제어하면서, 균등 섭동(uniform-perturbation) 베이스라인보다 3.5배 더 타이트한 강건성 인증(robustness certificates)을 제공하고, 첫 승인까지의 반복(iterations-to-first-admission) 속도를 46% 향상시켰으며, Enum+GA 대비 Chamfer-distance를 2.1배 감소시켰습니다. 추론에 특화된 작은 4B 규모의 모델이 프로토콜 내부에서 범용 70B 백본(backbones)과 경쟁할 수 있음을 입증하였으며, 이는 구조화된 프로토콜이 모델 규모의 차이를 부분적으로 상쇄할 수 있음을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기