OA-CutMix: CutMix의 레이블 편향(Label Bias) 교정
요약
CutMix의 레이블 할당 방식이 객체의 실제 의미론적 기여도를 반영하지 못하는 레이블 편향 문제를 지적합니다. 이를 해결하기 위해 세그멘테이션 마스크를 활용하여 객체 면적에 비례해 레이블을 할당하는 OA-CutMix를 제안합니다.
핵심 포인트
- CutMix의 레이블과 실제 객체 면적 간 평균 21.5% 불일치 발견
- 세그멘테이션 마스크 기반의 OA-CutMix로 레이블 편향 교정
- 이미지 혼합 절차를 유지하면서도 높은 정확도 달성
- 특히 작은 객체(small objects) 탐지 성능에서 큰 개선 효과
CutMix는 사실상의 표준(de facto standard) 혼합 증강(mixing augmentation) 기법이 되었으나, 그 레이블 할당은 결함이 있는 가정에 기반하고 있습니다. 즉, 붙여넣은 패치(patch)의 면적이 혼합된 이미지에 대한 의미론적 기여도(semantic contribution)를 충실히 반영한다는 가정입니다. 그러나 실제로는 패치가 배경 영역에 떨어지는 경우가 빈번하며, 이로 인해 객체가 보이지 않는 클래스에 레이블 크레딧(label credit)이 할당됩니다. CutMix 레이블과 의미론적 객체 면적 사이의 평균 불일치는 $21.5%$에 달합니다. 샘플의 $17%$에서는 이미지가 가시적인 객체 픽셀을 전혀 기여하지 않음에도 불구하고 0이 아닌 레이블 가중치를 받습니다.
우리는 사전 계산된 세그멘테이션 마스크(segmentation masks)에서 유도된 가중치로 면적 기반의 CutMix 가중치를 대체하여 이러한 편향을 교정하는 Object-Aware CutMix (OA-CutMix)를 제안합니다. 이는 각 이미지가 혼합에 기여하는 가시적인 객체 면적에 비례하여 레이블을 할당합니다. 이미지 혼합 절차는 완전히 변경되지 않은 채 유지됩니다. 우리는 4개의 아키텍처(architectures)와 6개의 데이터셋에 걸쳐 10개 이상의 정적 및 동적 혼합 방법(static and dynamic mixing methods)을 대상으로 OA-CutMix를 평가합니다. OA-CutMix는 모든 작업에서 일관되게 가장 높은 정확도를 달성하며, 동적 혼합 방법조차 능가하면서도 훈련 시간 비용은 극히 일부에 불과합니다. 개선 효과는 CutMix의 레이블 편향이 가장 큰 작은 객체(small objects)에서 가장 크게 나타납니다. 따라서 레이블을 교정하는 것만으로도 이미지 혼합 알고리즘을 수정하는 방법들의 성능과 대등하거나 이를 능가하기에 충분합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기