arXiv논문2026. 05. 14. 14:27

주변 조건부 브리지(Marginal-Conditioned Bridges)를 통한 Flow Language Models 샘플링

요약

본 논문은 Flow Language Models (FLMs)을 위한 새로운 샘플링 기법인 '주변 조건부 브리지(Marginal-Conditioned Bridges)'를 제안합니다. 기존의 표준 DDPM 스타일 샘플러는 FLM 토큰 주변 분포에 적합하지 않아 유효한 원-핫 시퀀스를 생성하기 어렵습니다. 대신, 이 방법은 사후 예측적 접근 방식을 사용하여 깨끗한 원-핫 종단점을 샘플링하고, 여기에 조건화된 해석적 Ornstein--Uhlenbeck 브리지를 적용하여 다음 연속 상태를 샘플링합니다.

핵심 포인트

FLMs는 원-핫 인코딩 토큰 시퀀스에 연속 흐름 매칭을 적용하는 언어 모델 클래스이다.
기존 DDPM 스타일 샘플러는 FLM의 주변 분포 특성을 반영하지 못하여 비효율적이다.
제안된 방법은 사후 예측적(posterior-predictive) 접근 방식을 채택하며, 깨끗한 원-핫 종단점과 조건화된 브리지를 결합한다.
이 샘플러는 별도의 학습 없이 표준 평가를 사용하며, 온도 스케일링 등 토큰 수준 디코딩 제어 인터페이스를 제공한다.
Girsanov 경로 공간 비교를 통해 주변 조건부 브리지가 고정된 평균 브리지보다 우수함을 수학적으로 증명했다.

Flow Language Models (FLMs)는 원-핫 인코딩된 (one-hot encoded) 토큰 시퀀스를 위해 연속적 흐름 매칭 (continuous flow matching)을 적용하는 최근 도입된 언어 모델 클래스입니다. 이들의 디노이저 (denoiser)는 일반적인 연속 확산 모델 (continuous diffusion models)에는 없는 특별한 구조를 가집니다. 즉, 디노이징 평균 (denoising mean)의 각 블록은 해당 위치의 깨끗한 토큰 (clean token)에 대한 사후 주변 분포 (posterior marginal distribution)입니다. 표준 DDPM 스타일의 샘플러는 이러한 주변 분포를 단일 조건부 평균 (conditional-mean) 종단점으로 붕괴시키고, 이 심플렉스 값 (simplex-valued) 지점을 향해 브리지 (bridge)를 형성하는데, 이는 일반적으로 유효한 원-핫 시퀀스가 아닙니다. 우리는 FLM을 위한 자연스러운 샘플러는 대신 사후 예측적 (posterior-predictive)이어야 한다고 주장합니다. 각 역과정 단계 (reverse step)에서, 우리는 FLM 토큰 주변 분포에 의해 정의된 인수분해된 사후 분포 (factorized posterior)로부터 깨끗한 원-핫 종단점을 샘플링한 다음, 해당 종단점에 조건화된 해석적 Ornstein--Uhlenbeck 브리지 (analytic Ornstein--Uhlenbeck bridge)로부터 다음 연속 상태를 샘플링합니다. 이 방법은 별도의 학습이 필요 없으며 (training-free), 표준 샘플링과 동일한 모델 평가를 사용하고, 온도 스케일링 (temperature scaling) 및 뉴클리어스 절단 (nucleus truncation)과 같은 토큰 수준의 디코딩 제어를 위한 원칙적인 인터페이스를 제공합니다. 우리는 정확한 사후 주변 분포 하에서, 종단점 근사 오차 (endpoint approximation error)가 토큰 위치 간의 조건부 다중 정보 (conditional multi-information)와 정확히 일치함을 보여줍니다. 유도된 1단계 브리지 커널 (one-step bridge kernel)은 모든 토큰별 사후 예측적 주변 분포를 보존하며, 오직 잔차적인 위치 간 의존성 (residual cross-position dependence)만을 소실합니다. 마지막으로, 우리는 주변 조건부 브리지가 고정된 조건부 평균 브리지 (frozen conditional-mean bridge)보다 디노이징 오차 항이 더 크지 않음을 보여주는 Girsanov 경로 공간 비교 (Girsanov path-space comparison)를 증명하며, 중간 좌표별 브리지 관측값이 깨끗한 토큰에 대한 추가 정보를 드러낼 때마다 엄격한 개선이 이루어짐을 보여줍니다. FLM을 이용한 실험을 통해 이 샘플러가 품질-다양성 트레이드오프 (quality--diversity tradeoff)를 개선함을 보여줍니다. 코드는 다음에서 확인할 수 있습니다: github.com/imbirik/mcb.

AI 자동 생성 콘텐츠

원문 바로가기

주변 조건부 브리지(Marginal-Conditioned Bridges)를 통한 Flow Language Models 샘플링

요약

핵심 포인트

댓글