RSS헤드라인2026. 06. 11. 05:42

DiffusionGemma

요약

Google이 실험적으로 공개했던 Gemini Diffusion 모델의 연구 결과가 새로운 오픈 웨이트 Gemma 모델인 google/diffusiongemma-26B-A4B-it으로 재탄생했습니다. 이 모델은 NVIDIA NIM 클라우드 API를 통해 무료로 호스팅되어 사용 가능하며, 테스트 결과 초당 최소 500 토큰 수준의 성능을 보여주었습니다.

핵심 포인트

Google이 DiffusionGemma라는 오픈 웨이트 Gemma 모델을 공개했습니다.
NVIDIA NIM 클라우드 API에서 이 모델을 무료로 호스팅하여 사용할 수 있습니다.
테스트 결과, 해당 모델은 초당 최소 500 토큰의 성능을 보였습니다.

2026년 6월 10일 - Link Blog

DiffusionGemma (통해) 지난 5월 Google은 실험적인 Gemini Diffusion 모델을 잠시 공개했습니다. 당시 제가 미리보기 버전을 사용해보고 기록한 결과, 초당 857 토큰으로 작동하는 것을 확인했습니다. 흥미로운 모델이었지만, Google은 이에 대해 더 이상의 발표를 하지 않았습니다.

그 연구가 가장 좋은 방식으로 돌아왔습니다: 새로운 오픈 웨이트(Apache 2 라이선스) Gemma 모델인 google/diffusiongemma-26B-A4B-it으로 말입니다.

NVIDIA는 현재 이 모델을 NIM 클라우드 API에서 무료로 호스팅하고 있습니다. 저는 이 API를 사용하여 이 펠리컨 이미지를 생성했는데, 이는 2,409 토큰을 반환하는 데 4.4초(time uv run generate.py 기준)가 걸렸습니다. 즉, 최소 초당 500 토큰입니다.

Flat minimalist illustration of a white pelican with a large orange beak riding a red bicycle with black wheels, against a pale blue background with a green line representing the ground

최근 기사

Claude Fable 5에 대한 초기 인상 - 2026년 6월 9일
MicroPython 및 WASM으로 샌드박스에서 Python 코드 실행하기 - 2026년 6월 6일
Claude Opus 4.8: "소박하지만 확실한 개선" - 2026년 5월 28일

AI 자동 생성 콘텐츠

원문 바로가기

DiffusionGemma

요약

핵심 포인트

최근 기사

댓글