본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 12. 21:08

DiffusionGemma: 토큰 단위가 아닌 256개 블록으로 병렬 생성하는 26B MoE 모델

요약

DiffusionGemma는 텍스트를 토큰 단위가 아닌 256개 블록으로 병렬 생성하는 26B MoE 모델입니다. 이 모델은 추론 시 활성 파라미터가 3.8B에 불과하여 GPU 환경에서 기존 대비 최대 4배 빠른 속도를 제공합니다.

핵심 포인트

  • DiffusionGemma는 256개 블록으로 병렬 생성하는 MoE 모델입니다.
  • 총 파라미터는 26B이나, 활성 파라미터는 3.8B에 불과합니다.
  • GPU 추론 속도가 기존 대비 최대 4배 빠릅니다.

DiffusionGemma: 토큰 단위가 아니라 256개의 블록으로 병렬하게 텍스트를 생성하는 26B MoE 모델로, 추론 시 활성 파라미터는 단지 3.8B에 불과하며 GPU에서 최대 4배 빠릅니다. Apache 2.0 라이선스이며 Hugging Face에서 이용 가능합니다.
https://t.co/fzs2iWwVsz https://t.co/qUnWsQdcl0

AI 자동 생성 콘텐츠

본 콘텐츠는 X @camilleroux (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0