arXiv논문2026. 06. 15. 07:41

Masked Diffusion Language Models에서의 Confidence Remasking 재평가

요약

Masked Diffusion Language Models(dLLMs)의 성능 향상을 위한 사후 신뢰도 기반 remasking 기법을 재평가한 연구입니다. 실험 결과, 특정 디코딩 설정에서 기존 방식 대비 이점이 적으며, 비탐욕적 디코딩 시에는 다양성 붕괴를 악화시킬 수 있음을 확인했습니다.

핵심 포인트

dLLMs의 초기 샘플링 오류를 해결하기 위한 remasking 기법 분석
WINO 등 사후(post-hoc) 방식의 실질적 효용성 재검토
표준 디코딩 설정에서 신뢰도 기반 언마스킹 대비 이점 미비
비탐욕적 디코딩 시 다양성 붕괴(diversity collapse) 현상 심화 확인

Masked diffusion language models (dLLMs)는 최근 병렬 토큰 생성 (parallel token generation)을 통한 더 빠른 추론 (inference) 가능성을 제시하며, 자기회귀 언어 모델 (autoregressive language models)의 경쟁력 있는 대안으로 부상했습니다. 그러나 마스크 기반 공식 (masked formulation)의 눈에 띄는 한계는 일단 토큰이 언마스킹 (unmasked)되면 더 이상 수정할 수 없다는 점이며, 이로 인해 dLLMs는 초기 샘플링 오류에 취약합니다. 이를 해결하기 위해, 자기 수정 (self-correcting, remasking) 기능을 통해 masked dLLMs를 확장하려는 연구가 점점 늘어나고 있습니다. 이러한 방법론 중 매력적인 하위 집합은 토큰 신뢰도 (token confidences)를 기반으로 훈련이 필요 없는 사후 방식 (training-free, post-hoc manner)을 사용하며, 초기 보고된 결과들은 고무적이었습니다. 본 연구에서는 대표적인 사후 remasking 방법인 WINO [Hong et al., 2026]의 경험적 평가를 재검토하였으며, 표준 디코딩 설정 (짧은 블록 길이) 하에서는 신뢰도 기반 언마스킹 (confidence-based unmasking) [Wu et al., 2025] 단독 사용에 비해 이점이 거의 없음을 발견했습니다. 평가를 비탐욕적 디코딩 (non-greedy decoding)으로 확장했을 때, 신뢰도 기반 remasking이 증가된 확률성 (stochasticity)으로 인해 발생하는 오류를 어느 정도 완화할 수는 있지만, 기존에 신뢰도 기반 언마스킹에서 보고되었던 다양성 붕괴 (diversity collapse) 현상을 더욱 악화시킨다는 것을 확인했습니다. 종합적으로, 우리의 결과는 사후 신뢰도 기반 remasking의 이점이 설정에 따라 크게 달라짐을 보여주며, 더욱 포괄적인 평가 프레임워크의 필요성을 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Masked Diffusion Language Models에서의 Confidence Remasking 재평가

요약

핵심 포인트

댓글