생물학적 시스템의 역학 예측을 위한 시계열 그래프 학습의 응용
요약
본 연구는 정적인 파운데이션 모델의 한계를 극복하기 위해 시계열 그래프 학습을 활용하여 세포의 시간적 진화 과정을 모델링합니다. 유전자 조절 네트워크를 진화하는 그래프 구조로 표현함으로써, 기존 모델보다 뛰어난 유전자 발현 및 조절 역학 예측 성능을 입증했습니다.
핵심 포인트
- 시계열 그래프 신경망을 통한 세포 상태의 동적 모델링
- 의사시간 궤적 기반의 유전자 조절 네트워크 재구성
- scGPT 등 기존 파운데이션 모델 대비 우수한 예측 성능
- 유전자 허브 식별 및 복잡한 조절 역학 포착 가능
생물학적 파운데이션 모델 (Biological foundation models)은 유전자 발현 행렬 (gene-expression matrices)에 트랜스포머 (transformer) 아키텍처를 직접 적용함으로써 단일 세포 표현 학습 (single-cell representation learning)에서 강력한 성능을 보여주었습니다. 그러나 이러한 접근 방식은 주로 정적인 환경에서 작동하며, 세포 내 발달 프로그램의 시간적 진화 (temporal evolution)를 명시적으로 모델링하지 않습니다. 이러한 역학 (dynamics)을 모델링하는 것은 발달 또는 질병 진행 과정 동안 세포 상태가 어떻게 점진적으로 나타나고, 분화하며, 재구성되는지를 이해하는 데 중요합니다. 본 진행 중인 연구 (work-in-progress) 논문에서, 우리는 세포 상태를 의사시간(pseudotime)으로 분해된 유전자 조절 네트워크 (gene regulatory networks)를 통해 표현하고, 지속적인 유전자 정체성을 기반으로 진화하는 그래프 구조로 모델링하는 대안적인 시계열 그래프 기반 관점을 조사합니다. 단일 세포 전사체 데이터 (single-cell transcriptomic data)로부터 시작하여, 우리는 의사시간 궤적 (pseudotime trajectories)을 추론하고, 세포를 발달 스냅샷 (developmental snapshots)으로 이산화하며, 스냅샷당 하나의 유전자 조절 네트워크를 재구성하고, 시계열 그래프 신경망 (temporal graph neural networks)을 적용하여 생물학적 상태를 예측합니다. 우리는 공개적으로 사용 가능한 두 가지 마우스 발달 데이터셋인 적혈구 낭배 형성 (erythroid gastrulation) 및 췌장 내분비 발생 (pancreatic endocrinogenesis)에서 유전자 발현 예측 (gene-expression forecasting), 링크 예측 (link prediction), 그리고 외차 중심성 예측 (out-degree centrality prediction)이라는 세 가지 상호 보완적인 과제를 고려하여 이 프레임워크를 평가합니다. 우리의 결과는 그래프 기반 모델이 scGPT 및 scFoundation과 같은 잘 알려진 파운데이션 모델 (foundation-model)보다 뛰어난 성능을 보임을 나타내며, 이는 진화하는 조절 구조를 명시적으로 모델링하는 것이 정적인 사전 학습된 표현 (static pretrained representations) 이상의 유용한 정보를 제공함을 시사합니다. 링크 예측 및 중심성 예측의 경우, 시계열 그래프 학습 (temporal graph learning)은 복잡한 조절 역학을 포착하고 시간적으로 중요한 유전자 허브 (gene hubs)를 식별할 수 있게 합니다. 전반적으로, 우리의 연구 결과는 시계열 그래프 학습이 역동적인 생물학적 시스템을 모델링하기 위한 유망한 방향이자, 단일 세포 생물학의 현재 파운데이션 모델 접근 방식에 대한 보완적인 패러다임임을 뒷받침합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기