본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 05. 13:47

EasyLens: 의료용 시각-언어 모델(VLM)을 위한 학습이 필요 없는 플러그 앤 플레이 방식의 미세 병변 표현 증폭기

요약

EasyLens는 의료용 시각-언어 모델(VLM)이 미세한 병변을 더 잘 인식하도록 돕는 학습이 필요 없는 플러그 앤 플레이 방식의 증폭기입니다. EasyBank와 EasyTag, EasyAmplifier를 통해 추가 학습 없이도 병변 관련 시각적 단서를 강화하여 탐지 성능을 높입니다.

핵심 포인트

  • 추가 학습이나 모델 적응이 필요 없는 플러그 앤 플레이 방식
  • 미세 병변의 시각적 단서가 희석되는 문제 해결
  • EasyBank를 통한 병리-해부학 프로토타입 공간 구축
  • 반사실적 추론을 통한 병변 관련 패치 선택 및 강화
  • 동결된(frozen) 의료용 VLM 백본에서도 높은 성능 입증

의료용 시각-언어 모델 (Vision-Language Models, VLMs)은 병변 탐지 및 보고서 생성을 포함한 임상 이미지 해석 분야에서 점점 더 높은 잠재력을 보여주고 있습니다. 그러나 이러한 모델들의 실질적인 유용성은 미세한 병변 (subtle lesions)에 대한 불충분한 민감도로 인해 여전히 제한적입니다. 미세 병변의 시각적 증거는 종종 희소하고, 대비가 낮으며, 복잡한 해부학적 맥락 속에 포함되어 있기 때문입니다. 국소적 시각 토큰 (local visual tokens)이 집계됨에 따라, 이러한 약한 병변 단서들은 전역 이미지 표현 (global image representations) 내에서 충분히 표현되지 못할 수 있으며, 이로 인해 의료용 VLM이 이를 인식하기 어렵게 만듭니다. 병변 민감도를 개선하기 위한 기존의 노력들은 주로 의료 도메인 시각 인코더 (vision-encoder) 사전 학습, 임상 용어 가이드 정렬 (clinical-term-guided alignment), 또는 학습 가능한 병리적 표현 강화 (trainable pathological representation enhancement)에 의존합니다. 이러한 방식들은 효과적이긴 하지만, 대개 추가적인 학습이나 모델별 적응 (model-specific adaptation)을 요구하며 특정 질병 형태에 과적합 (overfit)될 수 있어, 동결된 (frozen) 의료용 VLM에 대한 적용 가능성을 제한합니다.

이러한 한계를 해결하기 위해, 우리는 의료용 VLM을 위한 학습이 필요 없는 플러그 앤 플레이 (plug-and-play) 방식의 미세 병변 표현 증폭기인 EasyLens를 제안합니다. EasyLens는 먼저 병리-해부학 프로토타입 공간 (pathology-anatomy prototype space)인 EasyBank를 구축합니다. 이는 의심스러운 패치 (patches)를 병리적 패턴과 정상 해부학적 패턴 모두와 비교할 수 있도록 병변 관련 프로토타입 (prototypes)과 해부학적 인지 정상 참조 (anatomy-aware normal references)를 제공합니다. 정상 조직을 맹목적으로 증폭하는 것을 방지하기 위해, EasyTag는 반사실적 프로토타입 추론 (counterfactual prototype reasoning)을 통해 병변과 관련된 패치를 선택합니다. 전역 이미지 표현에서 미세한 병변 단서가 희석되는 것에 대응하기 위해, EasyAmplifier는 형태학적 가이드 잔차 강화 (morphology-guided residual enhancement)를 통해 선택된 병변 관련 패치 표현을 강화하며, 이를 통해 전역 이미지 임베딩 (global image embedding)에 대한 기여도를 높입니다. 여러 의료 이미지 데이터셋과 동결된 의료용 VLM 백본 (backbones)에 대한 실험 결과, EasyLens는 미세 병변 탐지 능력을 향상시키며 기존의 인코더 강화 (encoder-enhancement) 베이스라인 모델들보다 우수한 성능을 보임을 입증했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0