BTI-Net: 불확실성 인지 게이팅을 통한 다중 작업 의료 영상 분석용 양방향 디코더 레벨 작업 상호작용
요약
BTI-Net은 의료 영상의 분할과 분류를 동시에 수행할 때 작업 간 시너지를 극대화하는 양방향 디코더 구조를 제안합니다. 불확실성 프록시 어텐션(UPA)을 통해 작업 간 상호작용의 신뢰도를 동적으로 조절하여 성능을 높였습니다.
핵심 포인트
- 디코더 레벨에서 양방향 통신을 구축하는 TIM 모듈 도입
- 불확실성 프록시 어텐션(UPA)으로 작업 간 상호작용 게이팅
- 초음파, 더모스코피, 뇌 MRI 벤치마크에서 성능 향상 입증
- 추가적인 추론 오버헤드 없이 신뢰도 높은 신호 포착
의료 영상을 분할(segmentation)하고 분류(classification)하는 것을 공동으로 학습하려면 작업 간 시너지(cross-task synergy)가 필요하지만, 인코더 공유(encoder-sharing) 구조는 디코더 재구성을 각 작업 전용 표현(task-private representations)으로 제한하여, 각 브랜치가 서로에게 제공할 수 있는 경계 단서(boundary cues)와 의미론적 사전 정보(semantic priors)를 영구적으로 폐기합니다. 본 연구에서는 작업 상호작용 모듈(Task Interaction Modules, TIM)을 통한 두 개의 병렬 경로를 통해 모든 디코더 레벨에서 양방향 통신을 구축하는 BTI-Net을 소개합니다. 공간적 경계 컨텍스트(Spatial boundary context)는 분류 브랜치로 게이팅(gated)되어 들어가며, 전역적 의미론적 사전 정보(global semantic priors)는 디코더를 곱셈 방식으로 변조(multiplicatively modulate)하며, 정제된 특징(refined features)은 4개의 모든 디코더 해상도에 걸쳐 거친 의미론(coarse semantics)에서 미세한 경계 세부 사항(fine boundary detail)으로 점진적으로 전파됩니다. 모든 입력에 대해 작업 간 상호작용의 신뢰도가 동일하지 않기 때문에, 불확실성 프록시 어텐션(Uncertainty Proxy Attention, UPA)은 외부 주석(external annotations)이나 추가적인 추론 과정 없이도 작업 간 정렬(cross-task alignment), 장면 복잡도(scene complexity), 예측 신뢰도(prediction confidence)를 포착하는 세 가지 신호를 사용하여 인스턴스 및 레벨별로 각 TIM 출력을 게이팅합니다. 초음파, 더모스코피(dermoscopy), 뇌 MRI를 아우르는 세 가지 의료 벤치마크에서의 실험 결과, 인코더 공유(encoder-sharing) 및 디코더 상호작용(decoder-interaction) 베이스라인 모두에 대해 분할 IoU(segmentation IoU)와 분류 정확도(classification accuracy)에서 일관된 향상을 입증했습니다. 어블레이션(Ablation) 연구를 통해 적응형 게이팅(adaptive gating)이 고정된 양방향 상호작용(fixed bidirectional interaction)보다 IoU를 +2.36 향상시키며, 분류 정확도는 가장 강력한 다중 작업(multi-task) 베이스라인보다 최대 +2.26 포인트 향상됨을 확인했습니다. UPA의 불확실성 프록시(uncertainty proxies)는 확률적 샘플링(stochastic sampling)의 오버헤드 없이도 신뢰할 수 있는 단일 패스 작업 실패 신호(single-pass task-failure signals) 역할을 합니다. 코드: https://github.com/C-loud-Nine/BTI-Net_MTL
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기