이산 확산 언어 모델 (Discrete Diffusion Language Models) 정교화를 위한 드리프팅 목적 함수 (Drifting

이산 확산 언어 모델 (Discrete Diffusion Language Models, DDLMs)은 범주형 토큰 시퀀스 (categorical token sequences)를 반복적으로 디노이징 (denoising)하여 텍스트를 생성합니다. 반면, 연속형 생성기 (continuous generators)를 위한 최근의 드리프팅 (drifting) 방법론들은 이러한 샘플링 시간의 교정 (sampling-time correction) 중 일부를 반대칭 고정점 목적 함수 (anti-symmetric fixed-point objective)를 통해 학습 과정으로 흡수할 수 있음을 시사합니다. 본 연구에서는 이 원리를 DDLMs에 어떻게 전이할 수 있는지 연구하며, 여기서 주요 과제는 이산적 텍스트와의 인터페이스입니다. 즉, 하드 토큰 샘플 (hard token samples)은 미분 불가능하며, 범주형 예측 (categorical predictions)은 드리프팅을 위한 연속 샘플을 직접적으로 제공하지 않습니다. 우리는 범주형 예측을 소프트 토큰 특징 (soft-token features)으로 격상시키고, 동결된 의미 공간 (frozen semantic space)에서 반대칭 드리프팅을 적용하며, 결과적으로 발생하는 스톱 그래디언트 특징 타겟 (stop-gradient feature target)을 DDLM 로짓 (logits)으로 역전파하는 드리프팅 목적 함수인 TokenDrift를 공식화합니다. 마스크 (masked) 및 균일 상태 (uniform-state) 확산 백본 (diffusion backbones)을 사용한 통제된 지속 학습 (continual-training) 실험에서, TokenDrift는 일치하는 연속 학습 (continuation) 베이스라인 대비 고정된 NFE (Number of Function Evaluations)에서의 생성 품질을 향상시켰으며, MDLM에서는 4 NFE 기준 생성 퍼플렉서티 (Gen.-PPL)를 89% 감소시켰고, DUO에서는 86% 감소시켰습니다. 이러한 결과는 드리프팅이 DDLMs를 위한 실용적인 정교화 목적 함수 (refinement objective)를 제공할 수 있음을 시사합니다.

Insights

이산 확산 언어 모델 (Discrete Diffusion Language Models) 정교화를 위한 드리프팅 목적 함수 (Drifting

요약

핵심 포인트

댓글

Show GN: ts6to7 - TypeScript 5/6 → 7(tsgo) 마이그레이션 자동화 codemod

통신사가 1000조짜리 데이터센터를 짓겠다는데, 하필 왜 SK텔레콤일까.

AI가 코드를 대신 짜주는 시대에, 빅테크가 사람을 수천 명씩 고객 현장으로 보내고 있다.

Show GN: ts6to7 - TypeScript 5/6 → 7(tsgo) 마이그레이션 자동화 codemod

통신사가 1000조짜리 데이터센터를 짓겠다는데, 하필 왜 SK텔레콤일까.

AI가 코드를 대신 짜주는 시대에, 빅테크가 사람을 수천 명씩 고객 현장으로 보내고 있다.