
DiffusionGemma
요약
Google이 실험적으로 공개했던 Gemini Diffusion 모델의 연구 결과가 새로운 오픈 웨이트 Gemma 모델인 google/diffusiongemma-26B-A4B-it으로 재탄생했습니다. 이 모델은 NVIDIA NIM 클라우드 API를 통해 무료로 호스팅되어 사용 가능하며, 테스트 결과 초당 최소 500 토큰 수준의 성능을 보여주었습니다.
핵심 포인트
- Google이 DiffusionGemma라는 오픈 웨이트 Gemma 모델을 공개했습니다.
- NVIDIA NIM 클라우드 API에서 이 모델을 무료로 호스팅하여 사용할 수 있습니다.
- 테스트 결과, 해당 모델은 초당 최소 500 토큰의 성능을 보였습니다.
2026년 6월 10일 - Link Blog
DiffusionGemma (통해) 지난 5월 Google은 실험적인 Gemini Diffusion 모델을 잠시 공개했습니다. 당시 제가 미리보기 버전을 사용해보고 기록한 결과, 초당 857 토큰으로 작동하는 것을 확인했습니다. 흥미로운 모델이었지만, Google은 이에 대해 더 이상의 발표를 하지 않았습니다.
그 연구가 가장 좋은 방식으로 돌아왔습니다: 새로운 오픈 웨이트(Apache 2 라이선스) Gemma 모델인 google/diffusiongemma-26B-A4B-it으로 말입니다.
NVIDIA는 현재 이 모델을 NIM 클라우드 API에서 무료로 호스팅하고 있습니다. 저는 이 API를 사용하여 이 펠리컨 이미지를 생성했는데, 이는 2,409 토큰을 반환하는 데 4.4초(time uv run generate.py 기준)가 걸렸습니다. 즉, 최소 초당 500 토큰입니다.

최근 기사
- Claude Fable 5에 대한 초기 인상 - 2026년 6월 9일
- MicroPython 및 WASM으로 샌드박스에서 Python 코드 실행하기 - 2026년 6월 6일
- Claude Opus 4.8: "소박하지만 확실한 개선" - 2026년 5월 28일
AI 자동 생성 콘텐츠
본 콘텐츠는 RSS: Simon Willison's Weblog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기