arXiv논문2026. 04. 27. 19:12

지도 학습 기반 대조적 학습의 특징 귀속 속성 연구

요약

본 논문은 기존 분류 신경망이 사용하는 교차 엔트로피 손실 함수 대신 대조적 학습(Contrastive Learning, CL)을 활용하는 지도 기반 대조적 학습(SCL)의 특징을 탐구합니다. SCL은 데이터 포인트 간의 유사성 및 비유사성을 이용하여 임베딩 공간을 생성하며, 이는 적대적 견고성과 분포 외 탐지 측면에서 이점을 가집니다. 특히, 본 연구는 SCL로 훈련된 신경망이 기존 방식보다 특징 귀속 설명(feature attribution explanations)에서 더 높은 충실도, 복잡성, 연속성을 보여주어 모델의 투명성과 신뢰도를 높일 수 있음을 실증적으로 입증합니다.

핵심 포인트

대조적 학습(CL)은 분류를 직접 수행하기보다 유사한 데이터는 가깝게, 다른 데이터는 멀리 배치하는 임베딩 공간을 생성하도록 신경망을 훈련시킵니다.
지도 기반 대조적 학습(SCL)은 레이블 정보를 활용하여 군집화된 임베딩 공간을 만들며, 이는 적대적 견고성 및 OOD 탐지에서 이점을 제공합니다.
SCL로 훈련된 신경망은 기존 교차 엔트로피(CE) 기반 모델보다 특징 귀속 설명의 품질(충실도, 복잡성, 연속성)이 더 높습니다.
이는 단순히 높은 정확도를 넘어 모델의 투명성과 신뢰성을 확보하는 데 CL 기반 접근법이 유용함을 시사합니다.

대부분의 분류용 신경망 (NNs) 은 교차 엔트로피 (Cross-Entropy) 를 손실 함수로 사용하여 훈련됩니다. 이 접근법은 모델이 명시적인 분류 계층을 갖도록 요구합니다. 그러나 대조적 학습 (CL) 과 같은 대체 접근법이 존재합니다. CL 은 명시적으로 분류를 수행하는 대신, 유사한 데이터의 투영은 서로 끌어당기고 불유사한 데이터의 투영은 서로 밀어내는 특징을 가진 임베딩 공간을 생성하도록 NN 을 작동시킵니다. 지도 기반 대조적 학습 (SCL) 의 경우 레이블이 유사성 기준으로 채택되어 투영된 데이터 포인트가 잘 군집화된 임베딩 공간을 만듭니다. SCL 은 적대적 견고성 (adversarial robustness) 과 분포 외 탐지 (out-of-distribution detection) 측면에서 교차 엔트로피 (CE) 보다 결정적인 이점을 제공하여, 안전이 중요한 시나리오에서 더 자연스러운 선택지가 됩니다. 본 논문에서는 이미지 분류를 위해 SCL 로 훈련된 NN 들이 CL 보다 충실도 (faithfulness), 복잡성 (complexity), 연속성 (continuity) 측면에서 더 높은 품질의 특징 귀속 설명을 제공한다는 것을 경험적으로 보여줍니다. 이러한 결과는 더 신뢰할 수 있고 투명한 NN 을 목표로 하는 CL 기반 접근법에 대한 이전 발견을 강화하며, 정확도뿐만 아니라 모델의 투명성을 모두 표적으로 하는 훈련 목표 선택에 실무자를 안내할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

지도 학습 기반 대조적 학습의 특징 귀속 속성 연구

요약

핵심 포인트

댓글