잠재 가우시안 프로세스 (Latent Gaussian Process) 및 최적 운송 (Optimal Transport)을 이용한 시계열
요약
단일 세포 RNA 시퀀싱 데이터에서 시간적 과정을 추론하기 위해 잠재 이분산 가우시안 프로세스(Latent Heteroscedastic GP)와 최적 운송(Optimal Transport)을 결합한 새로운 생성 프레임워크를 제안합니다. 이 방법은 세포별 잠재 시간과 세포 유형을 통합하여 생물학적 이질성과 시간적 비동기성을 효과적으로 분리하며, 복잡한 보간 및 외삽 작업에서 뛰어난 성능을 보여줍니다.
핵심 포인트
- Hilbert 공간 방법을 사용하여 잠재 이분산 가우시안 프로세스로 집단 추세를 모델링함
- 최적 운송(Optimal Transport) 목적 함수를 통해 생성된 분포와 관찰된 분포를 정렬
- 세포별 잠재 시간 및 세포 유형 조건화를 통해 생물학적 이질성을 명시적으로 포착
- 섭동 궤적 추론을 위한 새로운 경사 기반(gradient-based) 전략 도입
- 기존 신경 미분 방정식 방식의 과적합 문제를 개선하고 생물학적 변동성을 고려함
단일 세포 RNA 시퀀싱 (Single-cell RNA sequencing)은 단일 세포 해상도에서 유전자 발현에 대한 통찰을 제공하지만, 이러한 정적인 스냅샷 측정값으로부터 시간적 과정 (temporal processes)을 추론하는 것은 여전히 근본적인 과제로 남아 있습니다. 신경 미분 방정식 (neural differential equations) 및 흐름 (flows)을 활용하는 현재의 접근 방식들은 과적합 (overfitting)에 민감하며 생물학적 변동성 (biological variability)에 대한 세심한 고려가 부족합니다. 본 연구에서는 Hilbert 공간 방법 (Hilbert space methods)으로 근사화된 잠재 이분산 가우시안 프로세스 (latent heteroscedastic Gaussian process, GP)를 사용하여 집단 추세 (population trends)를 모델링하는 생성 프레임워크 (generative framework)를 제안합니다. 실제 세포 궤적 (cell trajectories)의 부재를 해결하기 위해, 우리는 생성된 집단 분포와 관찰된 집단 분포를 정렬하는 최적 운송 (optimal transport, OT) 목적 함수를 활용합니다. 우리의 방법은 세포별 잠재 시간 (cell-specific latent time) 및 세포 유형 조건화 (cell type conditioning)를 통합함으로써, 시간적 비동기성 (temporal asynchrony)과 서로 다른 세포 유형으로의 궤적을 분리하여 생물학적 이질성 (biological heterogeneity)을 명시적으로 포착합니다. 우리는 복잡한 보간 (interpolation) 및 외삽 (extrapolation) 벤치마크에서 최첨단 (state-of-the-art) 성능을 입증하였으며, 섭동 궤적 (perturbation trajectories)을 추론하기 위한 새로운 경사 기반 (gradient-based) 전략을 소개합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기