SepsisAI Orchestrator: 조기 패혈증 탐지를 위한 AI 모델 배포 및 실시간 모니터링용 컨테이너화된 확장 가능 플랫폼
요약
패혈증 조기 탐지 모델을 실제 임상 환경에 배포하기 위한 오픈 소스 플랫폼 SepsisAI-Orchestrator를 제안합니다. Docker와 Kubernetes를 활용한 컨테이너화된 인프라를 구축하고, 부하 테스트를 통해 임상 AI 추론 워크로드의 최적 확장 동작을 분석했습니다.
핵심 포인트
- 임상 AI 모델의 배포 격차를 해결하는 모듈형 플랫폼 제시
- LightGBM 모델을 컨테이너화하여 REST API로 서비스
- Kubernetes 환경에서 CPU 스레드 기반의 최적 복제본 수 도출
- 과다 할당 시 스케줄러 경합으로 인한 성능 저하 현상 발견
임상 머신러닝 (Machine Learning) 문헌에서 강력한 예측 결과가 나타났음에도 불구하고, 이러한 모델들을 병상(bedside)에서 실제로 사용하는 것은 시스템 수준의 장벽들로 인해 여전히 제한적입니다. 즉, 이질적인 데이터 표현 (heterogeneous data representations), 표준화된 배포 워크플로우 (deployment workflows)의 부재, 그리고 연구용 프로토타입과 병원 환경의 동시성 (concurrency) 및 지연 시간 (latency) 요구사항 간의 불일치 등이 그 원인입니다. 본 논문에서는 조기 패혈증 탐지를 위한 이러한 배포 격차를 해결하는 오픈 소스 모듈형 플랫폼인 SepsisAI-Orchestrator를 제시합니다. 이 플랫폼은 HL7 FHIR에서 영감을 받은 임상 문서 아키텍처 (Clinical Document Architecture, CDA) 전처리, NoSQL 저장소, REST API를 통해 서비스되는 컨테이너화된 LightGBM 분류기, 그리고 Streamlit 기반의 임상 대시보드를 통합하며, Docker 및 Kubernetes를 통해 오케스트레이션 (orchestrated)됩니다. 이전에 검증된 LightGBM 모델 (PhysioNet 2019 데이터셋에서 F1 점수 0.87-0.94)을 수정 없이 재사용하였으며, 본 연구의 기여는 이를 둘러싼 인프라와 부하 상황에서의 경험적 특성 분석에 있습니다. 50~1000명의 동시 가상 사용자 (concurrent virtual users)를 대상으로 k6를 사용하여 테스트한 결과, 복제본 (replica) 수는 호스트의 물리적 CPU 스레드 수와 일치해야 함을 발견했습니다. 12스레드 CPU에서 복제본을 3개에서 12개로 확장하면 p95 지연 시간 (p95 latency)이 3.3초에서 1.41초로 감소(57.3% 감소)하고 모든 요청 실패가 제거되는 반면, 24개 또는 48개로 과다 할당 (over-provisioning)할 경우 스케줄러 경합 (scheduler contention)으로 인해 성능이 저하됩니다. 저희가 알기로는 이러한 U자형 확장 동작 (U-shaped scaling behavior)은 임상 AI 추론 (inference) 워크로드에 대해 이전에 정량화된 바 없습니다. 본 연구는 전향적 임상 검증 (prospective clinical validation)을 주장하지 않습니다. 소스 코드와 배포 매니페스트 (deployment manifests)는 https://github.com/nucleusai/sepsisai-orchestrator 에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기