arXiv논문2026. 05. 06. 12:50

TabSurv: 표본 데이터 생존 분석에 대한 현대적 신경망 아키텍처 적응

요약

TabSurv는 표본 데이터 기반의 생존 분석(survival analysis) 문제를 해결하기 위해 현대적인 신경망 아키텍처를 적응시킨 새로운 방법을 제안합니다. 이 방법은 검열 데이터를 지원하는 히스토그램 손실 함수(SurvHL)를 최적화하며, 특히 앙상블 구성 요소를 병렬로 학습하여 예측 다양성을 극대화한 심층 앙상블을 구현했습니다. 다양한 실제 생존 데이터셋에서 테스트된 결과, TabSurv는 기존의 주요 딥러닝 및 고전 베이스라인 대비 일관되게 우수한 성능을 입증했습니다.

핵심 포인트

TabSurv는 표본 데이터 기반 생존 분석에 현대적 신경망 아키텍처를 적용한 방법론이다.
검열 데이터를 처리하기 위해 새로운 히스토그램 손실 함수(SurvHL)를 사용한다.
앙상블 구성 요소를 병렬로 학습하여 예측 다양성을 높이는 심층 앙상블 구조를 채택했다.
다양한 실제 생존 데이터셋에서 기존의 주요 베이스라인들보다 평균적으로 우수한 성능을 보였다.

표본 데이터 (tabular data) 기반 생존 분석 (survival analysis) 은 잘 연구된 문제입니다. 그러나 기존 딥러닝 방법은 종종 매우 특정 작업에 특화되어 있어, 다른 도메인에서 새로운 접근법의 전이 (transfer) 를 제한하고 성능에 영향을 줄 수 있는 제약 조건을 도입할 수 있습니다.

우리는 Weibull 분포 또는 비모수 생존 예측 (non-parametric survival prediction) 을 사용하여 현대적 표본 데이터 아키텍처를 생존 분석에 적응시키는 TabSurv 방법을 제안합니다. TabSurv 는 검열 데이터 (censored data) 를 지원하는 새로운 히스토그램 손실 함수 (histogram loss function, SurvHL) 를 최적화합니다.

TabSurv 는 기본 전진 신경망 (feed-forward network) 외에도 생존 분석을 위한 MLP 의 심층 앙상블 (deep ensembles of MLPs) 을 구현합니다. 기존 연구와 달리, TabSurv 는 앙상블 구성 요소를 병렬로 학습하여 생존 분포 파라미터를 평균하기 전에 최적화하고, 이는 앙상블 구성 요소 예측 간의 다양성을 촉진합니다.

우리는 10 개 다양한 실제 세계 생존 데이터셋 (real-world survival datasets) 에서 제안된 아키텍처의 포괄적인 경험적 평가 (empirical evaluation) 를 수행했습니다. 우리의 결과는 TabSurv 가 RSF, DeepSurv, DeepHit, SurvTRACE 와 같은 기존 고전 및 딥러닝 베이스라인에 비해 평균적으로 일관되게 우위를 점함을 보여줍니다. 특히 Weibull 파라미터화를 사용하는 심층 앙상블은 비모수 모델보다 C-index 의 평균 순위 (average rank) 가 가장 높습니다.

종합하면, 우리의 연구는 현대적 표본 데이터 신경망이 생존 분석 문제를 해결하기 위해 어떻게 적응되고 훈련될 수 있는지를 명확히 하고, 강력하고 신뢰할 수 있는 접근법을 제공합니다. TabSurv 구현은 공개적으로 이용 가능합니다.

AI 자동 생성 콘텐츠

원문 바로가기

TabSurv: 표본 데이터 생존 분석에 대한 현대적 신경망 아키텍처 적응

요약

핵심 포인트

댓글