arXiv논문2026. 06. 15. 12:59

HumP-KD: 효율적인 화재 분류를 위한 하이브리드 불확실성 인지 다단계 점진적 지식 증류 프레임워크

요약

효율적인 화재 분류를 위해 불확실성을 인지하는 다단계 점진적 지식 증류 프레임워크인 HumP-KD를 제안합니다. 이 모델은 트랜스포머 교사 모델의 지식을 경량 MobileViT-S 학생 모델로 전달하여 높은 정확도와 실시간 성능을 동시에 확보했습니다.

핵심 포인트

계층적 점진적 지식 증류를 통한 변별력 있는 영역 선택적 가이드
다단계 증류 프로세스를 통해 훈련 과정 전반에 걸쳐 지식 전달 최적화
MobileViT-S 모델을 활용해 파라미터 수를 획기적으로 줄이면서 높은 F1 점수 달성
37.72 CPU FPS를 기록하여 자원 제한적 환경에서의 실시간 배포 가능성 입증

실시간 화재 분류 시스템은 정확하면서도 계산 효율적이고, 자원이 제한된 하드웨어에 배포 가능한 모델을 필요로 합니다. 본 연구는 효율적인 화재 분류를 위한 하이브리드 불확실성 인지 다단계 점진적 지식 증류 (Hybrid Uncertainty-aware Multi-stage Progressive Knowledge Distillation) 프레임워크인 \textbf{HumP-KD}를 제안합니다. 8,600개와 31,309개의 이미지를 포함하는 두 가지 데이터셋인 FlameVision과 Dataset-II가 사용되었습니다. 표준 전처리, 온라인 증강 (online augmentation), 가우시안 노이즈 (Gaussian noise) 및 모션 블러 (motion blur) 강건성 조건 하에서 다양한 CNN 및 트랜스포머 (transformer) 베이스라인이 적용되었습니다. 제안된 HumP-KD 모델은 세 가지 긴밀하게 통합된 구성 요소를 통해 두 개의 고정된 이기종 트랜스포머 교사 모델인 Swin-Tiny와 ViT-Base, 그리고 이들의 Meta-MLP 앙상블 (ensemble)로부터 지식을 경량 MobileViT-S 학생 모델로 증류합니다. 계층적 점진적 지식 증류 (Hierarchical Progressive Knowledge Distillation)는 계층적 특징 빌더 (Hierarchical Feature Builder)를 채택합니다. 이는 융합된 공간 주의 집중 마스크 (spatial attention mask)를 생성하여 증류가 변별력 있는 영역을 선택적으로 가이드하도록 합니다. 다단계 지식 증류 (Multi-Stage Knowledge Distillation)는 훈련 과정 전반에 걸쳐 세 가지 증류 단계를 점진적으로 활성화합니다. Dataset-II에서 HumP-KD는 10회의 독립적인 시행 결과 $0.9876 \pm 0.0063$의 평균 F1 점수를 달성하였으며, 이는 증류 없이 훈련된 MobileViT-S 베이스라인($0.9537 \pm 0.0351$)을 크게 상회하는 수치입니다. 이는 독립 t-검정 ($p = 0.0195$)과 Wilcoxon 부호 순위 검정 ($W = 1$, $p = 0.0039$) 모두에 의해 통계적 유의성이 확인되었습니다. 제안된 방법은 또한 데이터셋 전반에 걸친 강력한 일반화 능력과 저하된 시각적 조건에서의 강건성을 입증합니다. 학생 모델은 단 4.94M 개의 파라미터와 19.01Mb의 모델 크기만을 유지하여, Swin-Tiny 대비 $5.7\times$, ViT-Base 대비 $17.5\times$의 파라미터 감소를 나타내는 동시에 37.72 CPU FPS를 달성하여 실시간 배포에 적합합니다.

AI 자동 생성 콘텐츠

원문 바로가기

HumP-KD: 효율적인 화재 분류를 위한 하이브리드 불확실성 인지 다단계 점진적 지식 증류 프레임워크

요약

핵심 포인트

댓글