강건한 분류를 위한 잠재 그룹 발견
요약
머신러닝 모델의 가짜 상관관계 문제를 해결하기 위해 서브그룹 구조를 인코딩하는 신경 분류 트리(NCT) 프레임워크를 제안합니다. NCT는 별도의 서브그룹 주석 없이도 샘플을 트리 노드로 라우팅하여 소수 그룹을 효과적으로 분리하고 강건성을 확보합니다.
핵심 포인트
- 신경 분류 트리(NCT)를 통한 서브그룹 구조 인코딩
- 서브그룹 감독 없이 가짜 상관관계 및 소수 그룹 문제 해결
- 트리 토폴로지를 통한 모델의 해석 가능성 및 투명성 제공
- 5개 벤치마크 실험을 통해 최신 기술(SOTA) 수준의 강건성 입증
머신러닝 (Machine learning) 모델은 가짜 상관관계 (spurious correlations)를 이용하며, 높은 평균 정확도를 달성하지만 소수 그룹 (underrepresented subgroups)에서는 불균형적으로 실패합니다. 기존 방법들은 서브그룹 주석 (subgroup annotations) 또는 추론된 의사 그룹 레이블 (pseudo-group labels)의 안내를 받아 네트워크 파라미터를 조정함으로써 이 문제를 해결합니다. 그러나 추론 시, 이러한 방법들은 클래스 예측만을 생성할 뿐 샘플의 잠재적 서브그룹에 대한 통찰을 제공하지 못합니다. 우리는 트리 형태의 아키텍처에 서브그룹 구조를 인코딩하여 강건성 (robustness)을 달성하는 프레임워크인 신경 분류 트리 (Neural Classification Trees, NCT)를 제안합니다. 예측 정확도를 기반으로 각 샘플을 이 트리의 "쉬운 (easy)" 또는 "어려운 (hard)" 노드로 라우팅하고, 이러한 경로를 다음 반복을 위한 의사 레이블 (pseudo-labels)로 재사용함으로써, NCT는 서브그룹 감독 (subgroup supervision) 없이도 상충하는 서브그룹들을 분리합니다. 우리는 이진 및 다중 클래스 가짜 상관관계를 아우르는 5개의 벤치마크에서 NCT를 평가합니다. 실험 결과, 학습된 트리 토폴로지 (tree topology)는 소수 서브그룹을 일관되게 격리함으로써 강력한 해석 가능성 (interpretability)을 제공하며, 이는 모델 아키텍처와 데이터의 잠재적 그룹 구조 사이의 투명한 매핑을 제공하는 동시에 최신 기술 (state-of-the-art) 방법들과 경쟁력 있는 강건성을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기