자율적 LLM 가이드 트리 검색을 활용한 다중 병원체 전향적 질병 예측

감염병의 확률적 예측(Probabilistic forecasting)은 공중 보건에 매우 중요하지만, 전문가 모델링 팀의 노동 집약적인 수동 모델 큐레이션(manual model curation)에 의존하고 있습니다. 이러한 맞춤형 개발 방식은 세밀한 지리적 해상도나 신종 병원체에 대한 확장성을 저해하는 병목 현상을 일으킵니다. 본 연구에서는 대규모 언어 모델(Large Language Model, LLM) 가이드 트리 검색(tree search)을 사용하여 실행 가능한 예측 소프트웨어를 반복적으로 생성, 평가 및 최적화하는 자율 시스템을 제시합니다. 2025-2026년 미국 호흡기 질환 시즌 동안 진행된 완전한 전향적(prospective) 실시간 평가에서, 이 시스템은 인플루엔자(influenza), COVID-19, 그리고 호흡기 세포융합 바이러스(respiratory syncytial virus, RSV)에 대해 방법론적으로 다양한 모델들을 자율적으로 발견했습니다. 이러한 기계 생성 모델들을 결합함으로써, 표본 외(out-of-sample) 데이터에서도 인간이 큐레이션한 표준인 질병통제예방센터(Centers for Disease Control and Prevention, CDC) 허브 앙상블(hub ensembles)과 일치하거나 이를 능가하는 성능을 일관되게 보여주는 앙상블을 구축했습니다. 또한, 이 시스템은 데이터가 부족한 RSV의 '콜드 스타트(cold start)' 시나리오를 성공적으로 해결했습니다. 나아가, 통제된 사후 절제 연구(retrospective ablations)를 통해 로그 스케일 거리 지표(log-scale distance metrics)를 최적화하면 보상 해킹(reward hacking)을 방지할 수 있으며, 자동화된 판사 루프(judge-in-the-loop)가 복잡한 과학 이론에 대한 구조적 충실도(structural fidelity)를 보장한다는 것을 밝혀냈습니다. 역학 이론을 정확하고 투명한 코드로 자율적으로 변환함으로써, 이 프레임워크는 모델링 노동 병목 현상을 극복하고 전례 없는 규모로 전문가 수준의 질병 예측을 신속하게 배포할 수 있게 합니다.

Insights

자율적 LLM 가이드 트리 검색을 활용한 다중 병원체 전향적 질병 예측

요약

핵심 포인트

댓글

5주 동안 발생한 두 번의 상반된 가격 변동: 2026년에 AI 기능을 미터링(metering)하고 과금하는 방법

Claude Code 도입: 6가지 기준 거버넌스 스코어카드

Qwen3.8-Max Flutter 성능 디버깅 수정: 25% FPS 저하 해결

에이전트에게 '부탁'이 아닌 '강제'를 수행하기 — Omnigent 가드레일 입문

5주 동안 발생한 두 번의 상반된 가격 변동: 2026년에 AI 기능을 미터링(metering)하고 과금하는 방법

Claude Code 도입: 6가지 기준 거버넌스 스코어카드

Qwen3.8-Max Flutter 성능 디버깅 수정: 25% FPS 저하 해결

에이전트에게 '부탁'이 아닌 '강제'를 수행하기 — Omnigent 가드레일 입문