본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 05. 13:46

Gradient-Informed Logit Correction을 통한 이산 확산 모델(Discrete Diffusion Models)의 플러그

요약

이산 확산 모델의 제어 가능한 생성을 위해 추가 학습 없이 가이던스 신호를 효율적으로 추정하는 GILC 프레임워크를 제안합니다. Jacobian-free 메커니즘을 통해 로짓을 직접 수정함으로써 그래디언트 불안정성을 해결하고 DNA 및 단백질 서열 생성에서 뛰어난 성능을 입증했습니다.

핵심 포인트

  • 사전 학습된 네트워크를 재사용하는 플러그 앤 플레이 방식
  • Jacobian-free 메커니즘으로 그래디언트 불안정성 해결
  • 미분 가능/불가능한 보상 함수 모두 지원
  • 추가 학습 없이 DNA, 단백질 등에서 SOTA 성능 달성

이산 확산 모델 (Discrete Diffusion Models)을 이용한 제어 가능한 생성 (Controllable generation)은 종종 높은 계산 오버헤드나 재학습의 필요성으로 인해 어려움을 겪습니다. 본 논문에서는 사전 학습된 디노이징 네트워크 (Denoising network)를 변분 프록시 (Variational proxy)로 재사용하여 가이던스 신호 (Guidance signals)를 효율적으로 추정하는 플러그 앤 플레이 (Plug-and-play) 프레임워크인 Gradient-Informed Logit Correction (GILC)를 제안합니다. 고차원 이산 공간 (High-dimensional discrete spaces)에 내재된 그래디언트 불안정성 (Gradient instability)을 피하기 위해, 우리는 깨끗한 예측 로짓 (Clean prediction logits)을 직접 수정하여 안정적이고 효과적인 가이던스를 촉진하는 Jacobian-free 메커니즘을 도입합니다. 우리의 방법은 미분 가능한 (Differentiable) 보상 함수와 미분 불가능한 (Non-differentiable) 보상 함수를 모두 수용할 수 있습니다. DNA, 단백질 서열 (Protein sequence), 분자 생성 (Molecular generation) 작업에 걸친 광범위한 실험을 통해 GILC가 추가 학습 없이도 최첨단 (State-of-the-art) 성능을 달성하며, 빈번하게 미세 조정 (Fine-tuning) 접근 방식보다 뛰어난 성능을 보임을 입증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0