본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 17. 10:42

신뢰할 수 있는 자가 구성형 Big-Data-as-a-Service: 자동화된 데이터 엔지니어링, AutoML, MLOps 배포 및 드리프트

요약

LLM 오케스트레이션을 활용하여 데이터 수집부터 MLOps 배포 및 드리프트 탐지까지 전 과정을 자동화하는 자가 구성형 BDaaS 프레임워크를 제안합니다. 멀티 에이전트 협업을 통해 기존 AutoML의 한계를 극복하고 라이프사이클 전반의 신뢰성과 재현성을 높였습니다.

핵심 포인트

  • LLM 오케스트레이션 기반 멀티 에이전트 협업 구조 제안
  • 데이터 수집, 정제, AutoML, MLOps를 아우르는 통합 라이프사이클
  • 아티팩트 거버넌스 및 인간 참여형(Human-in-the-loop) 체크포인트 통합
  • 공변량 드리프트 탐지 및 적응형 피드백 루프 구현
  • 기존 AutoML 대비 높은 워크플로우 신뢰성 및 재현성 입증

Big-Data-as-a-Service (BDaaS) 플랫폼은 데이터 수집 (data ingestion), 정제 (cleaning), 특징 공학 (feature engineering), 모델 개발 (model development), 배포 (deployment) 및 배포 후 모니터링 (post-deployment monitoring) 전반에 걸쳐 신뢰할 수 있는 자동화를 필요로 합니다. 그러나 기존의 LLM 기반 데이터 과학 에이전트 및 AutoML 시스템은 주로 고립된 워크플로우 단계에 집중되어 있어, 라이프사이클 수준의 오케스트레이션 (orchestration), 아티팩트 거버넌스 (artifact governance), 인간의 감독 (human oversight) 및 드리프트 인지 적응 (drift-aware adaptation)에 대한 지원이 제한적입니다. 본 논문은 LLM 오케스트레이션 기반의 멀티 에이전트 협업을 바탕으로 한 신뢰할 수 있는 자가 구성형 (self-composable) BDaaS 프레임워크를 제안합니다. 제안된 아키텍처는 BDaaS 라이프사이클을 데이터 수집, 데이터 정제, 특징 공학, AutoML 학습, 모델 평가, MLOps 배포, 모니터링 및 드리프트 탐지를 위한 전문 에이전트들로 분해합니다. 중앙의 LLM 오케스트레이션 레이어는 에이전트 실행을 조정하고, 중간 출력물을 검증하며, 워크플로우 컨텍스트를 관리하고, 동적인 워크플로우 구성을 가능하게 합니다. 또한 이 프레임워크는 공유된 아티팩트 거버넌스, 재현성 지원, 인간 참여형 (human-in-the-loop) 체크포인트 및 드리프트 인지 피드백 루프를 통합합니다. 결측치, 범주형 변수, 이상치, 클래스 불균형 및 시뮬레이션된 공변량 드리프트 (covariate drift)가 포함된 통제된 정형 데이터 벤치마크 데이터셋을 사용하여 프로토타입 기반 평가를 수행했습니다. 수동 ML (manual ML), AutoML 전용, 그리고 단일 에이전트 LLM 베이스라인과 비교했을 때, 제안된 멀티 에이전트 BDaaS 파이프라인은 경쟁력 있는 예측 성능을 달성하는 동시에 워크플로우 완료, 아티팩트 추적성, 배포 준비성, 재현성 및 드리프트 복구(drift recovery)를 포함한 라이프사이클 수준의 신뢰성을 향상시켰습니다. 결과는 LLM 오케스트레이션 기반의 멀티 에이전트 시스템이 기존의 AutoML을 신뢰할 수 있고 적응 가능하며 생산 지향적인 BDaaS 라이프사이클 자동화로 확장할 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0