arXiv논문2026. 06. 23. 12:44

폐색전증 위험 평가를 위한 효율적인 멀티모달 임상 질의응답

요약

폐색전증(PE) 진단 및 예후 평가를 위한 멀티모달 벤치마크 데이터셋인 INSPECT를 제안합니다. CTPA 영상과 EHR 데이터를 결합하여 소형 멀티모달 언어 모델(MLLM)의 임상적 성능을 평가하고 그 잠재력을 확인했습니다.

핵심 포인트

19,402명의 환자 데이터를 포함한 멀티모달 PE 데이터셋 INSPECT 구축
CTPA 영상과 EHR 데이터를 결합한 멀티모달 질의응답 벤치마크 설계
Gemma4 E4B 및 E2B 모델이 EHR 결합 시 강력한 성능을 발휘함 확인
소형 MLLM이 초기 단계의 PE 위험 탐지 및 설명에 높은 잠재력 보유

폐색전증 (Pulmonary embolism, PE)은 적시의 진단과 향후 임상적 위험에 대한 신뢰할 수 있는 평가를 모두 요구하는 고위험 심폐 질환입니다. PE 관리는 통상적으로 컴퓨터 단층 촬영 폐동맥 조영술 (Computed tomography pulmonary angiography, CTPA), 방사선학적 판독, 그리고 종단적 전자 건강 기록 (Electronic health record, EHR) 증거를 결합하기 때문에, 소형 멀티모달 언어 모델 (Compact multimodal language models)을 평가하기 위한 임상적으로 의미 있는 환경을 제공합니다. 본 연구에서는 19,402명의 환자로부터 얻은 23,248개의 CTPA 연구를 포함하는 멀티모달 PE 데이터셋인 INSPECT를 사용하여, 효율적인 멀티모달 거대 언어 모델 (Multimodal large language models, MLLMs)을 활용한 벤치마크를 구축합니다. 우리는 8가지 진단 및 예후 과제를 구조화된 임상 질의응답 문제로 공식화하고, CTPA-Only, EHR-Only, 그리고 CTPA+EHR 설정 하에서 zero-shot 및 few-shot 프롬프팅을 사용하여 전형적인 효율적 MLLM들을 평가합니다. 결과에 따르면 Gemma4 E4B와 Gemma4 E2B는 EHR 증거가 사용 가능할 때, 특히 CTPA+EHR 입력 환경에서 더 강력한 성능을 발휘합니다. 과제 수준 분석을 통해 PE 진단이 예후 과제, 특히 재입원 예측보다 더 높은 성능을 달성함을 추가로 확인했습니다. 이러한 관찰 결과는 소형 멀티모달 모델이 초기 단계의 PE 위험 탐지 및 설명에 있어 큰 잠재력을 가지고 있음을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

폐색전증 위험 평가를 위한 효율적인 멀티모달 임상 질의응답

요약

핵심 포인트

댓글