폐 CT를 위한 파운데이션 모델(Foundation Models) 대 라디오믹스(Radiomics): 특징 추출기(Feature
요약
폐 CT 분석을 위해 파운데이션 모델과 라디오믹스 기법을 비교 벤치마킹한 연구입니다. 특징 추출기, 분류 헤드, 세그멘테이션 방식이 종양 부피, 생존 예측 등 다양한 임상 작업에 미치는 영향을 분석했습니다.
핵심 포인트
- Curia 모델과 CatBoost 헤드 조합이 임상 작업 전반에서 가장 우수한 성능을 보임
- 세그멘테이션은 부피 및 병기 분류에, 분류기 선택은 생존 및 조직학 예측에 결정적 영향
- 라디오믹스는 종양 부피 및 생존 예측에서 파운데이션 모델과 경쟁 가능한 수준임
- 소규모 코호트의 과적합 방지를 위해 2단계 설계(two-stage design) 방식 채택
라디오믹스(Radiomics)는 CT 기반의 폐암 표현형 분석(phenotyping)을 위한 확립된 접근 방식이지만, 파운데이션 모델(foundation models)과의 비교에서 특징 추출기(feature extractor), 분류 헤드(classification head), 세그멘테이션(segmentation) 선택의 기여도를 분리하거나 코호트 간(cross-cohort) 강건성을 테스트하는 경우는 드뭅니다. 우리는 5가지 특징 추출기(Curia, Curia-2, DINOv3, Radiomics2D, Radiomics3D), 7가지 분류 헤드(TabPFN, TabICL, XGBoost, CatBoost, Random Forest, logistic regression, Ridge), 그리고 3가지 세그멘테이션 체계(segmentation regimes)를 종양 부피 및 병기 분류(stage classification), 2년 생존 예측, 조직학적 분류(histology classification), 연령 예측이라는 5가지 작업에 대해 벤치마킹합니다. 모델은 LUNG1(n=338)에서 학습되었으며, 내부 테스트 세트(n=84)와 외부 LUNG2 코호트(n=211)에서 평가되었으며, 최악의 경우의 코호트 간 성능(worst-case cross-cohort performance)을 주요 지표로 사용했습니다. 지배적인 설계 요인은 작업에 따라 다릅니다. 세그멘테이션은 부피 및 병기 분류를 주도하는 반면, 분류기(classifier) 선택은 생존, 조직학, 연령 예측을 주도합니다. 라디오믹스는 종양 부피, 종양 병기 및 생존 예측에서 경쟁력이 있습니다(전자의 경우 라벨 유도 효과(label-derivation effects) 때문이기도 함). Curia 변형 모델들은 생존 예측에서 필적하는 최고 점수에 도달했습니다. DINOv3는 모든 작업에서 약간 미치지 못했습니다. 패치(Patch) 및 슬라이스(slice) 집계(aggregation)는 영향이 미미했습니다. 우리는 종양 세그멘테이션과 CatBoost 헤드를 결합한 Curia를 안전한 기본 설정(default)으로 권장하며, 이는 세 가지 주요 임상 작업 전반에서 가장 좋은 평균 순위를 달성했습니다. 다만, 작업별 특정 선택(task-specific selection)이 모든 작업에 적용 가능한 기본 설정보다 일관되게 우수한 성능을 보입니다. 종양 경계(tumor delineations)를 사용할 수 없는 경우, 폐 세그멘테이션과 logistic regression을 결합한 Curia-2가 경쟁력 있는 대안을 제공합니다. 모든 파이프라인은 엔드 투 엔드 미세 조정(end-to-end fine-tuning)이 과적합(overfitting)의 위험이 있는 소규모 코호트 크기에 적합한 2단계 설계(two-stage design)를 사용합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기