본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 04. 20:14

차원 축소 (Dimensionality Reduction) 를 위한 클래스 각도 왜곡 지수 (CADI)

요약

본 기술 기사는 데이터의 차원 축소(DR) 과정에서 클러스터 구조의 충실도를 평가하는 새로운 지표인 클래스 각도 왜곡 지수(CADI)를 제안합니다. 기존의 DR 품질 지표들은 클러스터 분리도에 초점을 맞추거나 원본 공간의 특정 형태(구형 등)를 가정하여 한계가 있었습니다. CADI는 점 삼중체 간의 내부 각도를 사용하여 투영된 클러스터 조직의 실제 충실도를 측정하며, 이 덕분에 해석 가능하고 최적화가 가능한 DR 기법 개발을 가능하게 합니다.

핵심 포인트

  • 차원 축소(DR) 방법은 전역적 구조 보존과 지역적 구조 보존이라는 관점에서 구분되며, 클러스터 시각화에 중요한 영향을 미칩니다.
  • 기존의 DR 품질 지표들은 클러스터 분리도 측정이나 원본 공간의 구형 가정을 따르므로 한계가 있습니다.
  • 새롭게 제안된 클래스 각도 왜곡 지수(CADI)는 점 삼중체 간의 내부 각도를 사용하여 투영된 클러스터 조직의 충실도를 평가합니다.
  • CADI는 각도 계산에 의존하므로 미분 가능하여, 이를 기반으로 한 최적화 가능한 DR 기법 개발이 가능합니다.

차원 축소 (DR) 기법은 데이터의 전역적, 고수준 구조를 보존하는지, 또는 지역적, 이웃 구조를 보존하는지에 따라 종종 구분됩니다. 이 구별은 시각화에 중요합니다: 전역적 방법은 클러스터 (cluster) 를 가릴 수 있고, 지역적 방법은 이를 과도하게 강조할 수 있습니다. 그러나 클러스터가 명확하게 나타나는 경우에도, 투영에서의 상대적 배열은 임의적이거나 오해의 소지가 있을 수 있으며, 이는 t-SNE 와 UMAP 와 같은 기법에서 흔한 문제입니다. 기존 클러스터 품질 지표는 클러스터 분리도를 측정하거나 원본 공간에서 구형 (spherical), 구형 (globular) 클러스터를 가정합니다. 우리는 클래스 각도 왜곡 지수 (Class Angular Distortion Index, CADI) 를 소개합니다. 이는 점 삼중체 (point triples) 간의 내부 각도를 사용하여 투영에서의 클러스터 조직의 충실도를 결정하는 지표입니다. 기존 클러스터 지표가 실패한 실제 및 합성 데이터 사례를 보여주며, CADI 는 해석 가능한 결과를 제공합니다. 각도 계산에 의존하므로 CADI 는 미분 가능 (differentiable) 하여 최적화를 가능하게 합니다. 우리는 이를 기반으로 한 CADI 기반 DR 기법을 증명합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0