arXiv논문2026. 05. 21. 10:52

중요도 평활화(Importance Smoothing)를 통한 심층 상태 공간 모델(Deep State Space Models)의 효율적인 학습

요약

심층 상태 공간 모델(DSSM)의 학습 효율성을 높이기 위해 새로운 학습 방법론인 병렬 변분 몬테카를로(PVMC)를 제안합니다. 기존의 오토인코딩 방식과 SMC 기반 방식 사이의 간극을 메워, 생성적 및 판별적 작업 모두에서 높은 성능을 보이며 기존 SMC 방식 대비 최대 10배 빠른 학습 속도를 달성했습니다.

핵심 포인트

기존 DSSM 학습 방식인 오토인코딩과 SMC 방식의 순차적 처리로 인한 확장성 문제를 해결함
병렬 변분 몬테카를로(PVMC)를 통해 생성적 및 판별적 작업 모두를 지원하는 새로운 학습 패러다임 제시
기존의 가장 빠른 SMC 방식보다 약 10배 빠른 학습 속도 구현
다양한 베이스라인 실험을 통해 최첨단(SOTA) 성능 또는 그 이상의 결과 입증

잠재 상태 공간 시스템(Latent state space systems)은 통계 모델링에서 도처에 존재하며, 시계열 데이터가 노이즈가 있는 측정 함수를 통해 관찰될 때 자연스럽게 발생합니다. 그러나 심층 상태 공간 모델(Deep State Space Models, DSSM)을 대규모로 학습시키는 것은 여전히 어려운 과제로 남아 있습니다. DSSM의 학습을 중심으로 크게 두 가지의 구별되는 전략과 문헌이 발전해 왔습니다. 첫째, 오토인코딩(Auto-encoding) DSSM은 변분 하한(Variational lower bound)을 최적화함으로써 생성적(Generative) DSSM을 학습합니다. 둘째, 고전적인 순차적 몬테카를로(Sequential Monte Carlo, SMC) 알고리즘의 출력을 역전파(Back-propagating)하여 학습하는 DSSM이 있습니다. 이러한 접근 방식들은 생성적 작업뿐만 아니라 판별적(Discriminative) 작업에 대해서도 DSSM을 학습시킬 수 있지만, 순방향 패스(Forward pass)의 순차성으로 인해 현대적인 하드웨어에서 확장성(Scale)이 떨어집니다. 본 논문에서는 두 패러다임 사이의 간극을 메우며, 판별적 및 생성적 작업 모두를 위한 DSSM 학습에 견고하게 사용될 수 있는 새로운 학습 방법인 병렬 변분 몬테카를로(Parallel Variational Monte Carlo, PVMC)를 제안합니다. 우리의 방법은 일련의 베이스라인 실험에서 최첨단(State-of-the-art) 또는 그 이상의 결과를 달성하였으며, 가장 빠른 경쟁 SMC 방식보다 10배 더 빠르게 학습합니다.

AI 자동 생성 콘텐츠

원문 바로가기

중요도 평활화(Importance Smoothing)를 통한 심층 상태 공간 모델(Deep State Space Models)의 효율적인 학습

요약

핵심 포인트

댓글