arXiv논문2026. 06. 26. 10:50

회복 탄력적 AI를 위한 적응형 유틸리티 기반 자원 오케스트레이션 (AURORA-AI)

요약

AURORA-AI는 비정상적 환경에서도 AI 시스템의 성능과 공정성을 유지하기 위한 적응형 자원 오케스트레이션 프레임워크입니다. 제어 이론과 강화학습을 결합하여 급격한 환경 변화 속에서도 계산 예산을 최적으로 재분배합니다.

핵심 포인트

Hamilton-Jacobi-Bellman 피드백 제어와 Lyapunov 안정성 모니터링 통합
예측 성능, 공정성, 비용, 지연 시간 등을 고려한 전역 유틸리티 최적화
블랙 스완 이벤트 발생 시 기존 PPO 대비 빠른 회복력 입증
인구 통계적 패리티 격차 감소 및 시스템 안정성 향상

현대의 AI 시스템은 비정상적(non-stationary)인 계산, 인구 통계 및 운영 조건 하에서 점점 더 많이 배포되고 있으며, 이러한 조건에서는 정적 자원 할당 전략이 예측 성능과 공정성(fairness) 및 설명 가능성(explainability)과 같은 인간 중심적 특성을 모두 저하시킵니다. 본 논문은 Hamilton-Jacobi-Bellman 피드백 제어(feedback control), Lyapunov 기반 안정성 모니터링(stability monitoring), 그리고 공정성을 고려한 복합 유틸리티(fairness-aware composite utility)를 단일 폐루프 정책(closed-loop policy)으로 통합하는 회복 탄력적 AI를 위한 적응형 유틸리티 기반 자원 오케스트레이션 프레임워크인 AURORA-AI를 제시합니다. 이 프레임워크는 예측 성능, 인구 통계적 패리티(demographic parity), 비용, 지연 시간(latency), 강건성(robustness) 및 해석 가능성(interpretability)에 대해 공동으로 정의된 전역 유틸리티가 중단 상황에서도 최대화된 상태를 유지할 수 있도록 이질적인 AI 모델 집단 전체에 걸쳐 계산 예산을 지속적으로 재분배합니다. 이 프레임워크는 인구 통계적 편향 충격(demographic bias shocks), 점진적인 개념 드리프트(concept drift), 그리고 갑작스러운 블랙 스완(black-swan) 중단을 동시에 주입하는 스트레스가 많은 이산 시간 시뮬레이션(discrete-time simulation)에서 평가되었으며, Static, Round Robin, Greedy, LinUCB, 그리고 Proximal Policy Optimisation (PPO) 기반의 심층 강화학습(deep reinforcement-learning) 에이전트를 포함한 5가지 기존 컨트롤러와 비교되었습니다. AURORA-AI는 Static 베이스라인의 88 타임 스텝 및 Proximal Policy Optimisation의 22 타임 스텝과 비교하여 블랙 스완 이벤트로부터 즉각적인 회복을 달성하였고, 알파 분위수(alpha-quantile)와 슈퍼 분위수(super-quantile)를 각각 29%와 25% 향상시켰으며, 동시에 평균 및 최대 인구 통계적 패리티 격차를 줄이고 Lyapunov 안정적 운영 단계의 비율을 높였습니다. 이러한 결과는 안정성 이론(stability theory)에 근거한 공정성 인식 적응형 오케스트레이션이 회복 탄력적인 인간 중심 AI 배포를 향한 실용적이고 이론적으로 동기 부여된 경로임을 나타냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

회복 탄력적 AI를 위한 적응형 유틸리티 기반 자원 오케스트레이션 (AURORA-AI)

요약

핵심 포인트

댓글