arXiv논문2026. 06. 01. 12:04

대리 가능도 추정기를 이용한 확장 가능한 추론 시간 어닐링 (Scalable Inference-Time Annealing with

요약

분자의 볼츠만 분포를 효율적으로 샘플링하기 위한 새로운 방법론인 SITA를 제안합니다. 에너지 기반 모델을 활용해 기존 방식의 복잡한 발산 계산 문제를 해결하고, 대규모 시스템에서도 확장 가능한 추론 시간 어닐링을 구현했습니다.

핵심 포인트

에너지 기반 모델을 통한 빠른 대리 가능도 추정
기존의 복잡한 발산 항 계산 문제를 해결하여 확장성 확보
Alanine Dipeptide 및 Tripeptide 실험에서 SOTA 성능 입증
흐름 기반 모델을 재학습시켜 점진적 온도 조절 구현

계산 화학 (Computational chemistry) 및 생물물리학 (Biophysics) 분야의 오랜 과제는 분자의 볼츠만 분포 (Boltzmann distribution)를 효율적으로 샘플링하는 것입니다. 생성 모델링 (Generative modeling)의 발전은 시뮬레이션의 계산 비용을 제거함으로써 기존 샘플링 기술의 한계를 해결하기 위해 제안되었습니다. 유망한 방향 중 하나는 추론 시간 어닐링 (Inference-time annealing) 동안 중요도 샘플링 (Importance sampling)을 통해 학습 데이터를 생성하며, 온도 사다리 (Temperature ladder)를 따라 확산 모델 (Diffusion models)을 반복적으로 미세 조정 (Finetuning)하는 것입니다. 불행히도, 이러한 방법들은 중요도 가중치 (Importance weights)를 추정하기 위해 스코어 필드 (Score field)에 대한 발산 (Divergence)을 계산해야 하며, 이는 더 큰 시스템에 대해서는 다루기 어렵게 만듭니다. 본 논문에서는 빠른 대리 가능도 (Surrogate likelihoods)를 용이하게 하기 위해 에너지 기반 모델 (Energy-based model)을 사용하여 점진적으로 낮은 온도에서 샘플을 생성하도록 흐름 기반 모델 (Flow-based models)을 재학습시키는 확장 가능한 추론 시간 어닐링 (Scalable Inference-Time Annealing, SITA)을 제시합니다. 우리는 비용이 많이 드는 발산 항 (Divergence terms)을 피하면서 Alanine Dipeptide 및 Alanine Tripeptide 모두에서 최첨단 (State-of-the-art) 성능을 입증했습니다. 우리의 코드는 다음에서 확인할 수 있습니다: https://github.com/countrsignal/sita.git

AI 자동 생성 콘텐츠

원문 바로가기

대리 가능도 추정기를 이용한 확장 가능한 추론 시간 어닐링 (Scalable Inference-Time Annealing with

요약

핵심 포인트

댓글