순위 상관관계(Ranking Correlation) 및 최근접 이웃(Nearest Neighbor)을 이용한 일 클래스 분류(One-class
요약
모든 머신러닝 모델을 일 클래스 분류(OCC) 모델로 근사하여 모델 자체를 분류하는 메타 분류 방법을 제안합니다. 정상성 순위와 최근접 이웃 지표를 활용해 데이터셋, 알고리즘, 하이퍼파라미터를 식별하는 연구입니다.
핵심 포인트
- 모든 ML 모델을 일 클래스 분류(OCC) 모델로 근사 가능함을 입증
- 정상성 순위 및 최근접 이웃 지표를 통한 메타 분류 프레임워크 제안
- 훈련 데이터셋, 알고리즘, 하이퍼파라미터 분류 성능 확인
- 데이터셋 분류를 위한 통합 솔루션 및 오픈소스 코드 제공
머신러닝 (Machine Learning, ML) 기술은 다양한 문제에 적용되어 왔습니다. 하지만 ML 모델에 ML을 적용하는 것은 아직 탐구되지 않은 방향입니다. 이를 위해 본 논문은 모든 ML 모델이 일 클래스 분류 (One-class Classification, OCC) 모델로 근사될 수 있다는 점에 착안하여, OCC 모델의 메타 분류 (Meta-classification)를 고려합니다. 제안된 방식은 OCC 모델을 정상성 순위 (Normality Rankings)로 표현하며, 최근접 이웃 (Nearest-neighbor) 및 순위 상관관계 (Ranking-correlation) 지표를 사용하여 이를 분류합니다. 실험에서는 클래스가 훈련 데이터셋, 알고리즘, 하이퍼파라미터 (Hyperparameters)에 대응하는 OCC 모델들을 분류합니다. 제안된 방식은 클래스 레이블이 데이터셋일 때 높은 정확도를 달성합니다. 또한, 훈련 데이터셋이 동일한 클래스를 포함하는 경우 알고리즘을 분류할 수 있습니다. 아울러, 본 논의는 OCC 모델의 분류가 본질적으로 여러 샘플을 하나의 입력으로 취급하는 데이터셋의 분류임을 강조합니다. 실험에서는 수면 기록을 사용하여 데이터셋을 분류함을 보여줍니다. 제안된 방법은 OCC 모델, 데이터셋, 그리고 순위를 분류하기 위한 통합된 솔루션을 제공할 수 있습니다. 소스 코드는 공개 저장소 https://github.com/ToshiHayashi/ClassOCC 에 업로드되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기