arXiv논문2026. 06. 10. 11:11

Pre-AF 13: 퇴원 보고서에서 추출한 해석 가능한 심방세동 위험 점수

요약

CVD 환자의 퇴원 보고서 데이터를 활용하여 심방세동(AF) 위험을 예측하는 해석 가능한 머신러닝 모델을 개발했습니다. NLP 기술로 비정형 데이터를 구조화하여 기존 임상 점수보다 높은 예측 성능을 입증했습니다.

핵심 포인트

NLP와 Transformer 기반 NER을 활용한 비정형 데이터 구조화
기존 임상 위험 점수 대비 우수한 ROC AUC 성능 달성
SHAP 분석을 통한 모델의 해석 가능성 확보
13개 핵심 특징을 활용한 Pre-AF 13 모델 구축

배경. 심방세동 (Atrial fibrillation, AF)은 가장 흔한 심장 부정맥이며 예후를 결정하는 주요 요인입니다. 기존의 AF 위험 점수들은 심혈관 질환 (Cardiovascular disease, CVD) 환자들에게 거의 보편적으로 나타나는 요인들(고령, 고혈압)에 의존하고 있어, 이 고위험군 내에서의 계층화 능력은 제한적입니다. 또한 대부분은 중기 예측보다는 장기(5~10년) 예측을 목표로 합니다. 본 연구에서는 일상적으로 수집되는 병원 데이터를 사용하여 CVD 환자의 24개월 및 전체 추적 관찰 기간 동안의 AF 위험을 예측하는 해석 가능한 머신러닝 (ML) 모델을 개발했습니다.

방법. 2012년 1월부터 2019년 5월 사이에 1회 이상 입원한, AF 기왕력은 없으나 CVD를 가진 18세 이상의 환자를 대상으로 한 러시아 국립 연구 심장 센터 (National Research Cardiology Center)의 전자 건강 기록 (Electronic health records, EHR)에 대한 단일 센터 후향적 연구입니다. 맞춤형 자연어 처리 (Natural Language Processing, NLP) 파이프라인을 통해 비정형 퇴원 보고서를 73개의 구조화된 특징 (Features)으로 변환하였으며, 이는 규칙 기반 파서 (Rule-based parser)와 트랜스포머 (Transformer) 기반의 개체명 인식 (Named Entity Recognition, NER)을 결합한 것입니다. LightAutoML을 사용하여 전체 모델 (73개 특징), 단순 모델 (축소된 하위 집합), 그리고 병상용 위험 점수를 위한 선형 모델을 구축했습니다. 성능은 ROC AUC를 통해 평가되었으며, CHARGE-AF, C2HEST, MHS, HAVOC와 비교되었고 SHAP을 통해 해석되었습니다.

결과. 45,000명의 환자로부터 얻은 80,576개의 기록 중 17,562개가 포함 기준을 충족하였으며, 1,438명(8.19%)이 AF로 진행되었습니다. 전체 모델은 ROC AUC 0.735(24개월) 및 0.696(전체 추적 관찰)에 도달하였고, 단순 모델은 이와 거의 동일했습니다(0.725, 0.696). 모든 비선형 모델은 4개의 임상 위험 점수(ROC AUC 0.53-0.64)보다 우수한 성능을 보였습니다. 단순 모델은 13개의 특징을 사용하며 Pre-AF 13으로 명명되었습니다. SHAP 분석 결과 연령과 좌심방 용적 (Left atrial volume)이 주요 예측 인자로 확인되었습니다. 선형 위험 점수 (Pre-AF 9)는 관찰된 24개월 AF 발생률을 약 7%에서 36%까지 계층화했습니다.

결론. 일상적으로 수집된 EHR 데이터로 구축된 해석 가능한 ML 모델은 기존의 임상 위험 점수보다 뛰어난 성능을 보이며, AF 고위험 CVD 환자를 식별해냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

Pre-AF 13: 퇴원 보고서에서 추출한 해석 가능한 심방세동 위험 점수

요약

핵심 포인트

댓글