대장 내시경 전 임상적 특징을 이용한 아프리카계 미국인의 고위험 대장 용종 예측: 머신러닝 모델 개발 및 시계열 검증
요약
아프리카계 미국인 코호트를 대상으로 대장 내시경 전 비침습적 데이터를 활용해 고위험 대장 용종을 예측하는 머신러닝 모델 연구입니다. 신경망, XGBoost 등 다양한 모델을 개발하고 시계열 외부 검증을 통해 모델의 유효성을 입증했습니다.
핵심 포인트
- 비침습적 임상 데이터를 통한 고위험 용종 예측 모델 개발
- 신경망, Random Forest, XGBoost 등 다양한 알고리즘 비교 검증
- 아프리카계 미국인 대상의 데이터 편향 해소 및 의료 형평성 제고
- 내부 및 외부 코호트를 활용한 시계열 검증 수행
고위험 대장 용종에 대한 위험 계층화 (Risk stratification)는 일반적으로 대장 내시경 (colonoscopy) 및/또는 병리학적 소견에 의존합니다. 그러나 대장 내시경 전에 이용 가능한 비침습적 특징들이 고위험 환자를 식별하는 데 도움이 될 수 있는지에 대한 관심이 높아지고 있습니다. 이러한 접근 방식은 대장 내시경 자원이 제한적인 상황에서 고위험 용종을 보유할 가능성이 가장 높은 개인에 대한 감시를 우선시함으로써 임상적 의사결정을 향상시킬 수 있는 동시에, 저위험 환자의 불필요한 시술을 줄일 수 있습니다. 중요한 점은, 비침습적이고 시술 전 단계의 정보를 사용하는 것이 특히 대장 내시경 자원이 제한적이거나 불균등하게 분포된 환경에서 위험 계층화에 대한 보다 공평한 접근을 촉진하는 데 도움이 될 수 있다는 것입니다. 본 연구의 목적은 다양하고 주로 아프리카계 미국인으로 구성된 도시 코호트에서, 비침습적인 대장 내시경 전 인구통계학적, 임상적 및 행동적 특징만을 사용하여 고위험 대장 용종을 예측하는 머신러닝 모델을 개발하고 외부 검증 (external validation)하는 것입니다. 우리는 Howard University Hospital에서 대장 내시경을 받은 환자들의 인구통계학적, 생활 방식 및 동반 질환 데이터를 사용하여 고위험 대장 용종을 예측하기 위한 신경망 (neural networks), 랜덤 포레스트 (random forest), 서포트 벡터 머신 (SVM), 나이브 베이즈 (Naive Bayes), 로지스틱 회귀 (logistic regression), 의사결정 나무 (decision trees), k-최근접 이웃 (KNN) 및 XGBoost를 포함한 여러 머신러닝 모델을 개발하고 검증하는 후향적 코호트 연구를 수행했습니다. 고위험 용종 (HRP)은 융모성 또는 관상융모성 선종 (villous or tubullovillous adenomas), 고등급 이형성증 (high-grade dysplasia), 10mm 이상의 크기의 용종, 및/또는 시술당 3개 이상의 용종 존재로 정의되었으며, 그 외의 모든 사례는 저위험 용종 (LRP)으로 분류되었습니다. 데이터셋에는 내부 검증을 위해 사용된 2015-2022년 사이의 환자 4,681명과 외부 검증을 위해 사용된 2023-2024년 사이의 환자 1,562명이 포함되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기