안전하고 적응 가능한 클라우드 힐링: 신경-기호적 월드 모델을 통한 LLM 생성 복구 계획 검증
요약
LLM의 추론 능력과 신경-기호적 월드 모델을 결합하여 클라우드 시스템의 결함을 자율적으로 복구하는 PASE 프레임워크를 제안합니다. 이 시스템은 계획 합성, 시뮬레이션 검증, 메타 프롬프트 최적화를 통해 복구 시간을 40% 이상 단축합니다.
핵심 포인트
- PASE 프레임워크는 LLM을 핵심 계획 합성 엔진으로 활용함
- 신경-기호적 월드 모델을 통해 생성된 복구 계획의 실행 가능성을 검증함
- DRL 기반 메타 프롬프트 최적화로 LLM의 계획 프로세스를 가이드함
- 기존 방식 대비 시스템 복구 시간을 40% 이상 단축하는 성능 입증
클라우드 기반 AI 시스템의 규모와 복잡성이 계속해서 확대됨에 따라, 신속한 결함 탐지(fault detection)와 적응형 복구(adaptive recovery)를 통해 서비스 신뢰성을 보장하는 것이 중요한 과제가 되었습니다. 기존의 접근 방식들은 의미론적 이해를 위해 대규모 언어 모델(LLMs)을 통합하고 정책 최적화를 위해 심층 강화학습(DRL)을 사용하지만, LLM의 생성 및 추론 능력을 충분히 활용하지 못하는 순차적이고 느슨하게 결합된 아키텍처에 의존하는 경우가 많습니다. 본 논문에서는 복구를 신경-기호적 프로그램 합성(neuro-symbolic program synthesis) 작업으로 재개념화한 새로운 결함 자가 치유 프레임워크인 PASE(Planning-Aware Semantic self-healing engine)를 통해 패러다임의 전환을 제안합니다. PASE는 LLM을 핵심 계획 합성 엔진(Plan Synthesis Engine)으로 채택하여 의미론적 프리미티브(semantic primitives) 라이브러리로부터 구조화된 복구 계획을 생성합니다. 신경-기호적 월드 모델(Neural-Symbolic World Model)은 시뮬레이션을 통해 계획의 실행 가능성을 검증하며, DRL을 통해 학습된 메타 프롬프트 최적화기(Meta-Prompt Optimizer)는 LLM의 계획 프로세스를 안내하는 최적의 프롬프트를 생성하는 법을 학습합니다. 이러한 긴밀한 '추론-계획-검증-적응(reason-plan-verify-adapt)' 루프는 미리 정의된 행동 공간을 넘어 동적이고 문맥 인식적인 복구 전략 생성을 가능하게 합니다. 실제 클라우드 결함 주입 데이터셋에 대한 실험 결과, PASE는 최첨단(state-of-the-art) 방법론들을 유의미하게 능가하여 평균 시스템 복구 시간을 40% 이상 단축하고 미지의 결함 시나리오에서 결함 탐지 정확도를 향상시킴을 입증했습니다. 우리의 프레임워크는 LLM 기반 추론을 모델 보조 검증 및 메타 학습된 가이드와 통합함으로써 자율 시스템 관리를 발전시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기