TRCGL-Net: 생성적 데이터 증강 및 레이블 공생 모델링을 이용한 롱테일 멀티 레이블 흉부 X-레이 분류 프레임워크
요약
흉부 X-ray의 롱테일 분포 문제를 해결하기 위한 TRCGL-Net 프레임워크를 제안합니다. 확산 모델을 통한 데이터 증강과 그래프 컨볼루션 네트워크를 활용해 희귀 질환 분류 성능을 극대화했습니다.
핵심 포인트
- 텍스트 가이드 조건부 확산 모델로 고품질 꼬리 클래스 이미지 생성
- 채널 재가중치 및 클래스 인식 어텐션으로 특징 판별력 강화
- 그래프 컨볼루션 네트워크를 통한 레이블 공생 관계 모델링
- PadChest 데이터셋 실험 결과 SOTA 성능 달성
흉부 X-ray 멀티 레이블 분류 (multi-label classification)는 지능형 의료 영상 진단에서 핵심적인 과제입니다. 그러나 실제 임상 데이터는 종종 극단적인 롱테일 분포 (long-tailed distributions)를 보이며, 이는 꼬리 클래스 (tail classes)에 속하는 희귀 질환에 대한 성능 저하로 이어집니다. 이 문제는 데이터 부족뿐만 아니라 두 가지 본질적인 요인에 의해 발생합니다: 1) 복잡한 해부학적 배경 하에서 꼬리 클래스 병변 표현 (lesion representations)의 약화, 2) 레이블 공생 (label co-occurrence) 관계 모델링 시 헤드 클래스 (head classes)의 지배력입니다. 이러한 과제를 해결하기 위해, 우리는 TRCGL-Net을 제안합니다. 첫째, 학습 가능한 텍스트 가이드 조건부 확산 모델 (text-guided conditional diffusion model)을 사용하여 질병 의미론적 제약 조건 하에서 고품질의 꼬리 클래스 흉부 X-ray 이미지 샘플을 생성함으로써, 클래스 불균형을 완화하고 병리학적으로 일관된 의미론을 보존하는 동시에 희귀 질환 패턴의 데이터 다양성과 실재성을 향상시킵니다. 둘째, 질병 관련 특징 채널을 강조하여 특징 재보정 (feature recalibration)을 수행하는 채널 재가중치 (channel reweighting) 메커니즘을 도입하여, 롱테일 분포 하에서의 특징 판별력을 높입니다. 또한, 클래스별 어텐션 맵 (attention maps)을 생성하기 위해 클래스 인식 어텐션 (class-aware attention) 메커니즘을 적용하여, 모델이 질병 관련 영역을 국소화하고 미세한 병변 영역에 집중할 수 있도록 합니다. 마지막으로, 카테고리 간의 정보 전파 메커니즘을 구축하기 위해 레이블 공생에 기반한 그래프 컨볼루션 네트워크 (graph convolution network)를 도입합니다. PadChest 데이터셋에 대한 실험 결과, 제안된 방법은 꼬리 클래스 mAP 0.4904, 전체 mAP 0.4408, mAUC 0.8989를 달성하여 최첨단 (state-of-the-art) 방법들을 능가했습니다. TRCGL-Net은 롱테일 분포 하에서 희귀 질환에 대한 인식 성능을 효과적으로 향상시키고 흉부 X-ray 멀티 레이블 분류에서 극단적인 클래스 불균형의 영향을 완화합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기