생존 인지 적응(Survival-Aware Adaptation)을 통한 임상 생존 분석용 정형 데이터 파운데이션 모델(Tabular
요약
정형 데이터 파운데이션 모델을 임상 생존 분석에 적용하기 위한 경량 적응(lightweight adaptation) 방식을 제안합니다. 사전 학습된 표현 위에 생존 인지 헤드를 학습시켜, 기존 모델 대비 MIMIC-IV 및 eICU 데이터셋에서 우수한 성능을 입증했습니다.
핵심 포인트
- 정형 데이터 파운데이션 모델의 생존 분석 적용 가능성 탐구
- 다중 작업 로지스틱 회귀(MTLR) 헤드를 통한 경량 적응 방식 제안
- TabDPT, TabICL 등 주요 아키텍처의 생존 분석 성능 검증
- 기존 베이스라인 및 제로샷 모델 대비 높은 C-index 달성
사망률과 같은 사건 발생 시간(time-to-event) 결과를 예측하는 것은 임상 의사 결정의 근본적인 과제이며, 일반적으로 생존 분석(survival analysis)을 통해 다루어집니다. 고전적인 통계 및 딥러닝(deep learning) 접근 방식이 널리 연구되어 왔지만, 이들은 대개 작업 특화형 학습(task-specific training)과 충분한 라벨링된 데이터(labeled data)를 필요로 합니다. 최근 정형 데이터 파운데이션 모델(tabular foundation models)의 발전은 범용 표현(general-purpose representations)을 학습함으로써 새로운 패러다임을 제시합니다. 그러나 일반적인 응용 분야가 생존 분석 작업보다는 이산 분류(discrete classification)에 국한되어 있어, 임상 환경에서의 중도 절단된(censored) 사건 발생 시간 예측에 대한 적용 가능성은 아직 충분히 탐구되지 않았습니다. 본 연구에서는 사전 학습된 표현(pretrained representations) 위에 생존 인지 헤드(survival-aware head)를 직접 학습시킴으로써, 정형 데이터 파운데이션 모델을 임상 생존 분석에 적용하기 위한 경량 적응(lightweight adaptation) 접근 방식을 제안합니다. 우리는 TabPFN, TabDPT, TabICL을 포함한 대표적인 아키텍처를 연구하고, 우측 중도 절단된(right-censored) 사건 발생 결과를 모델링하기 위해 다중 작업 로지스틱 회귀(multi-task logistic regression, MTLR) 헤드를 사용하여 이들을 적응시킵니다. 우리는 다양한 공개 생존 벤치마크와 두 개의 대규모 ICU 코호트인 MIMIC-IV 및 eICU를 통해 이 접근 방식을 평가합니다. 연구 결과, 이러한 전이 학습(transfer learning) 접근 방식은 강력한 베이스라인(baselines)과 비교하여 경쟁력 있거나 우수한 성능을 달성함을 보여줍니다. MIMIC-IV에서 TabDPT-FT-MTLR은 0.856의 C-index에 도달하였으며, 이는 가장 우수한 비-파운데이션 모델(non-FM) 베이스라인(DeepSurv, 0.844) 대비 +1.4%, 가장 우수한 제로샷(zero-shot) 모델(0.802) 대비 +6.7%의 상대적 향상을 의미합니다. eICU에서는 TabICL-FT-MTLR이 0.797을 달성하여 각각 +1.7%(DeepSurv, 0.784) 및 +6.4%(0.749)의 이득을 얻었습니다. 이러한 발견은 사전 학습된 정형 데이터 표현을 생존 인지 목적 함수(survival-aware objectives)와 결합하는 것의 중요성을 강조하며, 정형 데이터 파운데이션 모델이 임상 생존 예측을 위한 실용적이고 효과적인 대안을 제공함을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기