자율적 LLM 가이드 트리 검색을 활용한 다중 병원체 전향적 질병 예측
요약
본 연구는 전문가의 수동 모델 큐레이션 없이 LLM 가이드 트리 검색을 통해 질병 예측 소프트웨어를 자율적으로 생성, 평가 및 최적화하는 시스템을 제안합니다. 이 시스템은 인플루엔자, COVID-19, RSV 등 다양한 병원체에 대해 CDC의 표준 앙상블과 대등하거나 이를 능가하는 예측 성능을 보여주었습니다. 특히 데이터가 부족한 상황에서도 효과적이며, 역학 이론을 투명한 코드로 자동 변환하여 모델링의 병목 현상을 해결합니다.
핵심 포인트
- LLM 가이드 트리 검색을 활용하여 예측 모델을 자율적으로 생성하고 최적화하는 프레임워크 제시
- 인플루엔자, COVID-19, RSV 등 다중 병원체에 대해 CDC 허브 앙상블 수준의 성능 달성
- 데이터가 부족한 '콜드 스타트' 시나리오(RSV)에서도 성공적인 예측 수행
- 로그 스케일 거리 지표 최적화를 통해 보상 해킹(reward hacking) 방지 및 구조적 충실도 확보
감염병의 확률적 예측(Probabilistic forecasting)은 공중 보건에 매우 중요하지만, 전문가 모델링 팀의 노동 집약적인 수동 모델 큐레이션(manual model curation)에 의존하고 있습니다. 이러한 맞춤형 개발 방식은 세밀한 지리적 해상도나 신종 병원체에 대한 확장성을 저해하는 병목 현상을 일으킵니다. 본 연구에서는 대규모 언어 모델(Large Language Model, LLM) 가이드 트리 검색(tree search)을 사용하여 실행 가능한 예측 소프트웨어를 반복적으로 생성, 평가 및 최적화하는 자율 시스템을 제시합니다. 2025-2026년 미국 호흡기 질환 시즌 동안 진행된 완전한 전향적(prospective) 실시간 평가에서, 이 시스템은 인플루엔자(influenza), COVID-19, 그리고 호흡기 세포융합 바이러스(respiratory syncytial virus, RSV)에 대해 방법론적으로 다양한 모델들을 자율적으로 발견했습니다. 이러한 기계 생성 모델들을 결합함으로써, 표본 외(out-of-sample) 데이터에서도 인간이 큐레이션한 표준인 질병통제예방센터(Centers for Disease Control and Prevention, CDC) 허브 앙상블(hub ensembles)과 일치하거나 이를 능가하는 성능을 일관되게 보여주는 앙상블을 구축했습니다. 또한, 이 시스템은 데이터가 부족한 RSV의 '콜드 스타트(cold start)' 시나리오를 성공적으로 해결했습니다. 나아가, 통제된 사후 절제 연구(retrospective ablations)를 통해 로그 스케일 거리 지표(log-scale distance metrics)를 최적화하면 보상 해킹(reward hacking)을 방지할 수 있으며, 자동화된 판사 루프(judge-in-the-loop)가 복잡한 과학 이론에 대한 구조적 충실도(structural fidelity)를 보장한다는 것을 밝혀냈습니다. 역학 이론을 정확하고 투명한 코드로 자율적으로 변환함으로써, 이 프레임워크는 모델링 노동 병목 현상을 극복하고 전례 없는 규모로 전문가 수준의 질병 예측을 신속하게 배포할 수 있게 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기