대리 가능도 추정기를 이용한 확장 가능한 추론 시간 어닐링 (Scalable Inference-Time Annealing with
요약
분자의 볼츠만 분포를 효율적으로 샘플링하기 위한 새로운 방법론인 SITA를 제안합니다. 에너지 기반 모델을 활용해 기존 방식의 복잡한 발산 계산 문제를 해결하고, 대규모 시스템에서도 확장 가능한 추론 시간 어닐링을 구현했습니다.
핵심 포인트
- 에너지 기반 모델을 통한 빠른 대리 가능도 추정
- 기존의 복잡한 발산 항 계산 문제를 해결하여 확장성 확보
- Alanine Dipeptide 및 Tripeptide 실험에서 SOTA 성능 입증
- 흐름 기반 모델을 재학습시켜 점진적 온도 조절 구현
계산 화학 (Computational chemistry) 및 생물물리학 (Biophysics) 분야의 오랜 과제는 분자의 볼츠만 분포 (Boltzmann distribution)를 효율적으로 샘플링하는 것입니다. 생성 모델링 (Generative modeling)의 발전은 시뮬레이션의 계산 비용을 제거함으로써 기존 샘플링 기술의 한계를 해결하기 위해 제안되었습니다. 유망한 방향 중 하나는 추론 시간 어닐링 (Inference-time annealing) 동안 중요도 샘플링 (Importance sampling)을 통해 학습 데이터를 생성하며, 온도 사다리 (Temperature ladder)를 따라 확산 모델 (Diffusion models)을 반복적으로 미세 조정 (Finetuning)하는 것입니다. 불행히도, 이러한 방법들은 중요도 가중치 (Importance weights)를 추정하기 위해 스코어 필드 (Score field)에 대한 발산 (Divergence)을 계산해야 하며, 이는 더 큰 시스템에 대해서는 다루기 어렵게 만듭니다. 본 논문에서는 빠른 대리 가능도 (Surrogate likelihoods)를 용이하게 하기 위해 에너지 기반 모델 (Energy-based model)을 사용하여 점진적으로 낮은 온도에서 샘플을 생성하도록 흐름 기반 모델 (Flow-based models)을 재학습시키는 확장 가능한 추론 시간 어닐링 (Scalable Inference-Time Annealing, SITA)을 제시합니다. 우리는 비용이 많이 드는 발산 항 (Divergence terms)을 피하면서 Alanine Dipeptide 및 Alanine Tripeptide 모두에서 최첨단 (State-of-the-art) 성능을 입증했습니다. 우리의 코드는 다음에서 확인할 수 있습니다: https://github.com/countrsignal/sita.git
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기