본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 09. 11:52

이중 교사 감독(Dual-Teacher Supervision)을 통한 시각적 프롬프팅과 특징 재구성 기반 이상 탐지의 결합

요약

객체의 크기, 시점, 조명 변화 등 실제 환경의 변동성에 취약한 기존 이상 탐지 모델의 한계를 극복하기 위한 새로운 방법론을 제안합니다. 시각적 프롬프팅, 교사 모델 동결 해제, 확산 모델 기반 데이터 증강을 결합하여 AeBAD 데이터셋에서 성능을 크게 향상시켰습니다.

핵심 포인트

  • 전경-배경 마스킹을 통한 시각적 프롬프팅 파이프라인 도입
  • 도메인 적응성을 위한 학생-교사 모델의 교사 모델 동결 해제 메커니즘
  • 확산 모델(Diffusion) 기반 합성 이미지를 활용한 데이터 증강 전략
  • AeBAD 데이터셋에서 기존 SOTA 대비 3.5%p 성능 향상 달성

최근의 이상 탐지 (Anomaly Detection) 방법론들은 MVTec과 같이 잘 정립된 데이터셋에서 완벽한 탐지 및 세그멘테이션 (segmentation) 점수를 달성하고 있습니다. 그러나 이러한 방법들 중 상당수는 일관된 객체 크기, 시점 (viewpoint), 배경, 조명, 그리고 중앙 배치와 같은 기본 가정들이 위배될 때 어려움에 직면합니다. 이러한 변동 사항이 발생하면 이상 탐지 방법론들을 많은 실제 환경 (real-world scenarios)에서 사용할 수 없게 됩니다. 이러한 한계를 해결하기 위해, 우리는 세 가지 핵심 기여를 소개합니다: (1) 전경-배경 마스킹 (foreground-background masking)을 사용하여 객체를 분리하는 시각적 프롬프팅 (visual prompting) 파이프라인; (2) 도메인 적응성 (domain adaptability)을 향상시키기 위해 학생-교사 (student-teacher) 모델에서 교사 (teacher) 모델의 동결을 해제하는 메커니즘; (3) 이상 탐지 성능을 높이기 위해 확산 모델 (diffusion)로 생성된 합성 이미지를 활용하는 데이터 증강 (data augmentation) 전략입니다. 우리는 Masked Multiscale Reconstruction (MMR) 모델을 백본 (backbone)으로 사용하여, 까다로운 AeBAD 데이터셋에서 기존의 최첨단 (state-of-the-art) 성능보다 3.5 퍼센트 포인트 향상된 결과를 달성했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0