지속성(Persistence)에서 생존 분석으로: 위상학적 특징에 대한 가설 검정, 효과 크기 및 벡터화
요약
본 논문은 위상 데이터 분석(TDA)에서 사용되는 지속성 다이어그램을 생존 분석 관점에서 재해석한 STRAND를 제안합니다. 이 방법은 지속성 값을 시간-사건으로 간주하여, 단일 표현만으로 비모수적 가설 검정, 효과 크기 도출, 그리고 머신러닝용 안정적인 특징 벡터화를 가능하게 합니다.
핵심 포인트
- 지속성 다이어그램을 생존 데이터로 취급하는 STRAND를 제안함.
- 단일 표현으로 가설 검정, 효과 크기, 특징 벡터화가 가능해짐.
- 비모수적 두 표본 검정과 1-Wasserstein 안정적인 벡터화를 제공함.
- fMRI/신경과학 데이터의 기능적 뇌 연결성 연구에 적용됨.
지속성 다이어그램(Persistence diagrams)은 위상 데이터 분석(topological data analysis)에서 흔히 사용되는 표현 방식이지만, 자연스럽게 벡터 공간에 존재하지 않으며, 이를 비교하기 위해 개발된 통계적 도구들은 다운스트림 예측에 사용되는 도구들과 크게 분리되어 발전해 왔습니다. 우리는 (집합의) PD를 생존 데이터로 취급하는 STRAND(Survival Topological Representation ANalysis of Diagrams)를 소개합니다. 여기서 지속성 값 $p = d - b$를 가진 각 위상학적 특징은 완전히 관찰된 시간-사건(time-to-event)이며, 지속성 생존 함수 $S(t) = ext{P}(p > t)$가 다이어그램 비교의 핵심 대상입니다. 이 단일 표현으로부터 우리는 (i) 적절하게 보정된 제1종 오류와 높은 검정력을 가진 소수의 다이어그램을 이용한 비모수적 두 표본 검정을, (ii) 해석 가능한 효과 크기(effect sizes), 그리고 (iii) 다운스트림 머신러닝을 위한 1-Wasserstein 안정적인 특징 벡터를 도출합니다. 우리는 통제된 위상학을 가진 합성 다양체에서 보정 및 검정력을 검증하고, 14개의 그래프 및 3D 포인트 클라우드 벤치마크 전반에 걸쳐 경쟁력 있는 벡터화를 입증하며, fMRI/신경과학 데이터의 기능적 뇌 연결성 연구에 이 방법을 적용합니다. 우리가 아는 한, STRAND는 단일하고 일관되며 해석 가능한 표현으로부터 지속성 다이어그램에 대한 가설 검정 및 벡터화를 제공하는 최초의 방법입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기