ROI 재고 및 합성 데이터를 통한 뇌 MRI 이상 탐지 및 추론 능력 향상
요약
뇌 MRI 진단의 신뢰성을 높이기 위해 명시적인 영역 표시(ROI Marking)를 도입한 BrReMark 프레임워크를 제안합니다. 가설 생성, 경계 상자 표시, 재검토로 이어지는 추론 과정을 통해 환각 현상을 줄이고 진단 정확도를 크게 향상시켰습니다.
핵심 포인트
- 명시적 영역 표시를 통한 공간적 근거(Spatial Grounding) 확보
- 강화학습과 지도 미세 조정을 결합한 구조화된 추론 궤적 학습
- 병리 합성 증강 전략을 통한 OOD 데이터 일반화 능력 강화
- 기본 모델 대비 mAP50 및 진단 정확도 대폭 향상
- 희귀 병리 현상에 대한 위양성(False Positives) 45.7% 감소
의료용 시각-언어 모델(Vision-Language Models)은 일반적으로 결론을 뒷받침하는 이미지 영역을 명시하지 않은 채 단일 패스 추론(single-pass inference)을 통해 진단을 생성합니다. 이러한 공간적 근거(spatial grounding)의 부재는 임상적 유용성을 제한합니다. 즉, 출력 결과를 감사(audit)할 수 없으며, 모델이 정상 스캔에서 소견을 환각(hallucinate)할 수 있습니다. 우리는 뇌 MRI 진단에 명시적인 영역 표시(region marking)를 도입하는 프레임워크인 BrReMark (Brain Rethink via ROI Marking)를 제시합니다. 이 모델은 먼저 잠재적 이상 징후에 대한 가설을 생성하고, 명시적인 경계 상자(bounding box) 표시를 통해 이를 근거화(grounding)한 다음, 표시된 증거를 재검토함으로써 결론을 검증합니다. 학습은 구조화된 추론 궤적(reasoning trajectories)에 대한 지도 미세 조정(supervised fine-tuning)과 위치 정확도(localization accuracy) 및 진단 추론(diagnostic reasoning)에 대한 복합 보상을 사용하는 강화학습(reinforcement learning)을 결합합니다. 또한, 분포 외(out-of-distribution, OOD) 데이터에 대한 모델의 일반화 능력을 향상시키기 위해 도메인 무작위화(domain randomization) 기반의 병리 합성 증강(pathology synthesis augmentation) 전략을 통합합니다. 내부 벤치마크에서 BrReMark는 기본 모델과 비교하여 mAP50을 0.74%에서 37.54%로 향상시켰으며, 21.57%의 Clinical F1과 45.26%의 진단 정확도를 달성했습니다. NOVA OOD 벤치마크에서도 최첨단(state-of-the-art) 기술 대비 위양성(false positives)을 45.7% 감소시키며 경쟁력 있는 전반적인 성능을 달성하였으며, 이는 희귀 병리 현상에 대한 환각이 감소했음을 나타냅니다. 이러한 결과는 명시적인 가설-검증 근거화(hypothesis-verification grounding)가 분포 내(in-distribution) 및 OOD 설정 모두에서 신뢰할 수 있는 개방형 뇌 MRI 진단으로 나아가는 실질적인 경로임을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기