arXiv논문2026. 06. 05. 13:46

Gradient-Informed Logit Correction을 통한 이산 확산 모델(Discrete Diffusion Models)의 플러그

요약

이산 확산 모델의 제어 가능한 생성을 위해 추가 학습 없이 가이던스 신호를 효율적으로 추정하는 GILC 프레임워크를 제안합니다. Jacobian-free 메커니즘을 통해 로짓을 직접 수정함으로써 그래디언트 불안정성을 해결하고 DNA 및 단백질 서열 생성에서 뛰어난 성능을 입증했습니다.

핵심 포인트

사전 학습된 네트워크를 재사용하는 플러그 앤 플레이 방식
Jacobian-free 메커니즘으로 그래디언트 불안정성 해결
미분 가능/불가능한 보상 함수 모두 지원
추가 학습 없이 DNA, 단백질 등에서 SOTA 성능 달성

이산 확산 모델 (Discrete Diffusion Models)을 이용한 제어 가능한 생성 (Controllable generation)은 종종 높은 계산 오버헤드나 재학습의 필요성으로 인해 어려움을 겪습니다. 본 논문에서는 사전 학습된 디노이징 네트워크 (Denoising network)를 변분 프록시 (Variational proxy)로 재사용하여 가이던스 신호 (Guidance signals)를 효율적으로 추정하는 플러그 앤 플레이 (Plug-and-play) 프레임워크인 Gradient-Informed Logit Correction (GILC)를 제안합니다. 고차원 이산 공간 (High-dimensional discrete spaces)에 내재된 그래디언트 불안정성 (Gradient instability)을 피하기 위해, 우리는 깨끗한 예측 로짓 (Clean prediction logits)을 직접 수정하여 안정적이고 효과적인 가이던스를 촉진하는 Jacobian-free 메커니즘을 도입합니다. 우리의 방법은 미분 가능한 (Differentiable) 보상 함수와 미분 불가능한 (Non-differentiable) 보상 함수를 모두 수용할 수 있습니다. DNA, 단백질 서열 (Protein sequence), 분자 생성 (Molecular generation) 작업에 걸친 광범위한 실험을 통해 GILC가 추가 학습 없이도 최첨단 (State-of-the-art) 성능을 달성하며, 빈번하게 미세 조정 (Fine-tuning) 접근 방식보다 뛰어난 성능을 보임을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Gradient-Informed Logit Correction을 통한 이산 확산 모델(Discrete Diffusion Models)의 플러그

요약

핵심 포인트

댓글