
Google이 Hugging Face에 DiffusionGemma를 출시했습니다
요약
Google이 Hugging Face에 DiffusionGemma라는 멀티모달 언어 모델을 출시했습니다. 이 모델은 이산 확산(discrete diffusion) 방식을 기반으로 하며, 병렬 확산을 통해 텍스트를 생성합니다. NVIDIA의 지원을 받아 양자화된 버전도 제공되어 높은 처리 속도를 자랑합니다.
핵심 포인트
- DiffusionGemma는 이산 확산 기반의 멀티모달 언어 모델입니다.
- 병렬 확산을 통해 텍스트를 생성하며, 고속 처리가 가능합니다.
- NVIDIA가 NVFP4 양자화 버전을 Hugging Face에 출시했습니다.
Google이 Hugging Face에 DiffusionGemma를 출시했습니다.
이산 확산(discrete diffusion)을 기반으로 하는 멀티모달 언어 모델입니다.
한 번에 256개의 토큰을 디노이즈하여 순차적으로 생성하는 방식 대신 처리합니다.
단일 GPU에서 초당 1,100개 이상의 토큰 속도를 보여줍니다.
여기서 확인하세요:
https://huggingface.co/google/diffusingemma-26B-A4B-it
…
더 알아보기:
https://ai.google.dev/gemma/docs/diffusiongemma
…
NVIDIA가 Hugging Face에 NVFP4 양자화된 DiffusionGemma를 출시했습니다.
26B MoE 멀티모달 모델로, 병렬 확산(parallel diffusion)을 통해 텍스트를 생성하며,
256K 컨텍스트와 Hopper에서 초당 1,100개 이상의 토큰 속도를 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기