arXiv논문2026. 05. 25. 16:48

LLM 엔진 통합을 통한 O-RAN에서의 고급 AI 서비스 프로비저닝 (Provisioning)

요약

O-RAN 아키텍처에서 AI 서비스를 신속하게 배포하기 위한 Dual-Brain 아키텍처를 제안합니다. LLM 기반 오케스트레이터와 경량 ML 엔진인 NeuralSmith를 결합하여 운영자의 의도를 자동화된 코드와 모델로 변환하는 워크플로우를 다룹니다.

핵심 포인트

LLM의 추론 능력과 경량 ML의 실시간성을 결합한 Dual-Brain 구조
운영자 의도를 데이터 수집 정책 및 배포 코드로 자동 변환
NeuralSmith를 통한 요청 기반 경량 분류기 학습 자동화
O-RAN 5G~SA 테스트베드를 통한 실질적 워크플로우 검증

Open Radio Access Network (O-RAN) 아키텍처는 모듈형 xApp 및 rApp을 통해 RAN에 AI를 직접 내장할 수 있도록 허용하지만, 이러한 애플리케이션을 생성하고, 데이터를 수집하며, 모델을 학습시키고, 코드를 작성하며, 이를 안전하게 배포하는 과정은 여전히 느리고 대부분 수동으로 이루어집니다. Large Language Models (LLMs)는 강력한 추론 및 코드 생성 능력을 제공하지만, 실시간 RAN 제어에 요구되는 빠르고 결정론적인 (deterministic) 추론에는 적합하지 않습니다. 본 논문에서는 두 가지 강점을 결합한 개념 증명(proof-of-concept) 단계의 Dual-Brain 아키텍처를 제시합니다. 이 아키텍처는 LLM 기반의 오케스트레이터 (orchestrator)가 운영자의 의도(intent)를 데이터 수집 정책 및 배포 코드로 변환하는 한편, 자동화된 ML 엔진인 NeuralSmith가 API를 통해 요청 시 경량 분류기 (classifier)를 학습시킵니다. 우리는 이 아키텍처와 프로비저닝 (provisioning) 워크플로우를 설명하고, 컨테이너화된 O-RAN 5G~SA 테스트베드로부터 얻은 실질적인 통찰을 공유하며, 향후 연구 방향에 대해 논의합니다.

AI 자동 생성 콘텐츠

원문 바로가기

LLM 엔진 통합을 통한 O-RAN에서의 고급 AI 서비스 프로비저닝 (Provisioning)

요약

핵심 포인트

댓글