본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 11:21

소아 뇌종양 MRI를 위한 확산 모델 기반 정교화 세그멘테이션 및 시각-언어 해석

요약

소아 뇌종양 MRI의 정확한 세그멘테이션과 임상 해석을 위해 확산 모델 기반의 2단계 딥러닝 프레임워크를 제안합니다. Swin-UNETR로 거친 예측을 수행한 후, 확산 모델을 통해 종양 경계를 정교화하고 다중 모달 언어 모델로 방사선 보고서를 자동 생성합니다.

핵심 포인트

  • 확산 기반 정교화 모델을 통한 종양 경계 세그멘테이션 성능 향상
  • 3D DDPM 및 MedSegDiff를 활용한 정교한 경계 일치도 달성
  • 다중 모달 언어 모델을 통한 구조화된 방사선 보고서 생성 기능 통합
  • 거친 단계에서 정교한 단계로 이어지는 Coarse-to-refined 워크플로우 제시

제한된 주석 데이터(annotated data), 이질적인 영상 표현형(imaging phenotypes), 확산된 종양 경계, 그리고 종양 하부 영역 간의 클래스 불균형(class imbalance)으로 인해 정확한 소아 뇌종양 세그멘테이션(segmentation)은 여전히 어려운 과제로 남아 있습니다. 본 연구에서는 다중 모달(multi-modal) 소아 뇌 MRI 세그멘테이션 및 임상적 해석을 개선하기 위한 2단계 딥러닝 프레임워크를 제시합니다. 첫째, BraTS-PEDs MRI 스캔에서 3D Res U-Net 및 Swin-UNETR 베이스라인을 평가하며, 네 가지 공동 등록된 모달리티(co-registered modalities)를 사용하여 종양 핵(tumor core), 전체 종양(whole tumor), 그리고 조영 증강 종양(enhancing tumor) 영역을 예측합니다. 둘째, 거친(coarse) Swin-UNETR 예측을 조건으로 하는 확산 기반 정교화 모델(diffusion-based refinement models)을 도입하며, 여기에는 3D DDPM 정교화 모델과 MedSegDiff가 포함됩니다. 조건부(Conditioning) 방식은 확산 안정성과 성능을 실질적으로 향상시키며, 특히 조영 증강 종양 경계 세그멘테이션에서 두드러집니다. 조건부 MedSegDiff는 가장 낮은 HD95를 기록하며 가장 강력한 경계 일치도를 달성했습니다. 마지막으로, 예측된 종양 부피와 대표적인 세그멘테이션 오버레이(segmentation overlays)를 다중 모달 언어 모델(multimodal language model)과 통합하여 구조화된 방사선 보고서 스타일의 리포트를 생성합니다. 종합적으로, 우리의 결과는 거친 단계에서 정교한 단계로 이어지는 확산 세그멘테이션(coarse-to-refined diffusion segmentation)이 소아 종양 경계 묘사를 개선하고, 엔드 투 엔드(end-to-end)로 해석 가능한 AI 지원 신경 종양학 워크플로우를 지원할 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0