자기회귀 볼츠만 생성기 (Autoregressive Boltzmann Generators)
요약
정규화 흐름(NF) 기반 볼츠만 생성기의 한계를 극복하기 위해 새로운 자기회귀 모델링 프레임워크인 ArBG를 제안합니다. ArBG는 위상적 제약을 우회하고 LLM 아키텍처를 활용하여 확장성을 높였으며, 펩타이드 시스템 샘플링에서 기존 모델보다 뛰어난 성능을 입증했습니다.
핵심 포인트
- 기존 흐름 기반 모델의 가역성 제약 및 계산 비용 문제 해결
- LLM 아키텍처를 활용한 향상된 확장성 및 순차적 추론 가능
- 1.32억 파라미터 규모의 전이 가능한 모델 'Robin' 소개
- 8-잔기 시스템에서 제로샷 에너지 오차(E-W2) 60% 이상 감소
열역학적 평형 상태에서의 분자 시스템을 효율적으로 샘플링하는 것은 통계 물리학의 핵심적인 과제입니다. 이러한 과제는 생성 모델 (generative model)을 정확한 가능도 (likelihoods) 및 중요도 샘플링 (importance sampling) 보정과 결합하여 상관관계가 없는 평형 샘플을 빠르게 생성할 수 있게 하는 볼츠만 생성기 (Boltzmann Generators, BGs)의 발전을 이끌어냈습니다. 그러나 현대의 BGs는 주로 정규화 흐름 (normalizing flows, NFs)에 의존하고 있으며, 이는 엄격한 가역성 제약 (이산 시간)으로 인한 제한된 표현력(expressivity) 문제나, 계산 비용이 많이 드는 가능도 (연속 시간) 문제 중 하나를 겪게 됩니다. 본 논문에서 우리는 흐름 기반 (flow-based) BG 패러다임에서 벗어나 이러한 한계를 극복하는 새로운 자기회귀 모델링 프레임워크인 자기회귀 볼츠만 생성기 (Autoregressive Boltzmann Generators, ArBG)를 제안합니다. ArBG는 흐름 (flows)의 위상적 제약 (topological constraints)을 우회하고 추론 시 순차적 개입 (sequential inference-time interventions)을 가능하게 하며, 대규모 언어 모델 (Large Language Models, LLMs)에서 효과적인 아키텍처를 활용함으로써 향상된 확장성 (scalability)을 제공합니다. 우리는 ArBG가 모든 벤치마크에서 흐름 기반 모델보다 상당한 개선을 가져온다는 것을 실증적으로 보여주었으며, 특히 10-잔기 (10-residue) Chignolin과 같은 더 큰 펩타이드 시스템에서 그러합니다. 나아가, 우리는 ArBG 프레임워크로 학습된 1억 3,200만 개의 파라미터를 가진 전이 가능한 모델인 Robin을 소개합니다. 이 모델은 이전의 최첨단 (state-of-the-art) 기술을 능가하여, 8-잔기 (8-residue) 시스템에서의 제로샷 에너지 오차인 E-W$_2$를 60% 이상 감소시켰습니다. 코드는 다음 링크에서 확인할 수 있습니다: https://github.com/danyalrehman/autobg.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기