낮은 Perplexity는 반복이다: 연속 확산 언어 모델(Continuous Diffusion LMs)에서의 1차원 자기 조건화

ELF와 같은 연속 확산 언어 모델(Continuous Diffusion Language Models)은 기록적으로 낮은 생성 Perplexity (Gen-PPL)를 보고합니다. 우리는 여기서 함정을 발견했습니다: 이 모델들은 인간의 텍스트보다 훨씬 더 많이 반복하며, Gen-PPL은 이러한 반복을 처벌하기보다 오히려 보상하기 때문에, 낮은 Gen-PPL 점수는 품질을 과장하게 됩니다. 반복을 제거하면 ELF-B의 Gen-PPL은 $19.5$에서 $27.7$로 상승합니다. 가장 작은 모델은 반복을 가장 많이 하기 때문에 심지어 가장 좋은 Gen-PPL을 기록하기도 합니다. 우리는 반복의 근원을 추적했습니다: 이는 각 단계의 깨끗한 추정치(clean estimate)를 다음 단계로 전달하는 자기 조건화 피드백 루프(self-conditioning feedback loop) 내의 extit{단일 방향(single direction)}을 따르는 수축적 끌개(contractive attractor)입니다. 이 실패는 1차원적이기 때문에 1차원적인 해결책만으로도 충분하며, 우리는 이를 제안합니다. extbf{ACE} (Attractor-Contrast-Escape)는 각 단계의 피드백에서 레이블이 없는(label-free) 해당 단일 방향을 뺍니다. $105$M 모델에서 한 번 추정된 이 방향은 품질을 경쟁력 있게 유지하면서 반복을 인간 수준에 가깝게 줄이며, $342$M 및 $652$M 모델과 다양한 샘플러(samplers)로 거의 변함없이 전이됩니다. 동일한 레시피는 다른 아키텍처에서도 유용한 방향을 복구합니다. Gen-PPL 자체가 반복을 보상하기 때문에, 우리는 대신 각 해결책이 인간 수준의 깨끗한 텍스트를 생성하는 데 필요한 연산량을 측정하며, ACE는 $1.5$--$5 imes$ 더 저렴합니다.

Insights

낮은 Perplexity는 반복이다: 연속 확산 언어 모델(Continuous Diffusion LMs)에서의 1차원 자기 조건화

요약

핵심 포인트

댓글

시장가의 3.6배. 위메이드 창업자 지분 39.33%에 중국계 자본이 쳐준 값이다. 종가 1만9330원짜리 주식을 주당 6만8910원, 총

구글이 제미나이 개인화 이미지 생성을 미국 무료 사용자 전원에게 풀었다. 유료 구독자 전용이던 기능인데, 왜 갑자기 공짜가 됐을까.

이것은 정말 AI가 생성한 것 같지 않네요, 너무 사실적입니다!!

AI 시대이기 때문에 더욱 사양과 설계가 필요하다고 생각한다

시장가의 3.6배. 위메이드 창업자 지분 39.33%에 중국계 자본이 쳐준 값이다. 종가 1만9330원짜리 주식을 주당 6만8910원, 총

구글이 제미나이 개인화 이미지 생성을 미국 무료 사용자 전원에게 풀었다. 유료 구독자 전용이던 기능인데, 왜 갑자기 공짜가 됐을까.

이것은 정말 AI가 생성한 것 같지 않네요, 너무 사실적입니다!!

AI 시대이기 때문에 더욱 사양과 설계가 필요하다고 생각한다