본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 27. 19:12

지도 학습 기반 대조적 학습의 특징 귀속 속성 연구

요약

본 논문은 기존 분류 신경망이 사용하는 교차 엔트로피 손실 함수 대신 대조적 학습(Contrastive Learning, CL)을 활용하는 지도 기반 대조적 학습(SCL)의 특징을 탐구합니다. SCL은 데이터 포인트 간의 유사성 및 비유사성을 이용하여 임베딩 공간을 생성하며, 이는 적대적 견고성과 분포 외 탐지 측면에서 이점을 가집니다. 특히, 본 연구는 SCL로 훈련된 신경망이 기존 방식보다 특징 귀속 설명(feature attribution explanations)에서 더 높은 충실도, 복잡성, 연속성을 보여주어 모델의 투명성과 신뢰도를 높일 수 있음을 실증적으로 입증합니다.

핵심 포인트

  • 대조적 학습(CL)은 분류를 직접 수행하기보다 유사한 데이터는 가깝게, 다른 데이터는 멀리 배치하는 임베딩 공간을 생성하도록 신경망을 훈련시킵니다.
  • 지도 기반 대조적 학습(SCL)은 레이블 정보를 활용하여 군집화된 임베딩 공간을 만들며, 이는 적대적 견고성 및 OOD 탐지에서 이점을 제공합니다.
  • SCL로 훈련된 신경망은 기존 교차 엔트로피(CE) 기반 모델보다 특징 귀속 설명의 품질(충실도, 복잡성, 연속성)이 더 높습니다.
  • 이는 단순히 높은 정확도를 넘어 모델의 투명성과 신뢰성을 확보하는 데 CL 기반 접근법이 유용함을 시사합니다.

대부분의 분류용 신경망 (NNs) 은 교차 엔트로피 (Cross-Entropy) 를 손실 함수로 사용하여 훈련됩니다. 이 접근법은 모델이 명시적인 분류 계층을 갖도록 요구합니다. 그러나 대조적 학습 (CL) 과 같은 대체 접근법이 존재합니다. CL 은 명시적으로 분류를 수행하는 대신, 유사한 데이터의 투영은 서로 끌어당기고 불유사한 데이터의 투영은 서로 밀어내는 특징을 가진 임베딩 공간을 생성하도록 NN 을 작동시킵니다. 지도 기반 대조적 학습 (SCL) 의 경우 레이블이 유사성 기준으로 채택되어 투영된 데이터 포인트가 잘 군집화된 임베딩 공간을 만듭니다. SCL 은 적대적 견고성 (adversarial robustness) 과 분포 외 탐지 (out-of-distribution detection) 측면에서 교차 엔트로피 (CE) 보다 결정적인 이점을 제공하여, 안전이 중요한 시나리오에서 더 자연스러운 선택지가 됩니다. 본 논문에서는 이미지 분류를 위해 SCL 로 훈련된 NN 들이 CL 보다 충실도 (faithfulness), 복잡성 (complexity), 연속성 (continuity) 측면에서 더 높은 품질의 특징 귀속 설명을 제공한다는 것을 경험적으로 보여줍니다. 이러한 결과는 더 신뢰할 수 있고 투명한 NN 을 목표로 하는 CL 기반 접근법에 대한 이전 발견을 강화하며, 정확도뿐만 아니라 모델의 투명성을 모두 표적으로 하는 훈련 목표 선택에 실무자를 안내할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0