
Google의 새로운 '모델', DiffusionGemma 소개
요약
Google이 DiffusionGemma라는 새로운 오픈소스 모델을 공개했습니다. 이 모델은 기존의 순차적인 자기회귀 방식 대신, 확산(diffusion) 방식을 사용하여 텍스트를 병렬적으로 생성하고 정제합니다. 이를 통해 속도를 획기적으로 높여 고품질의 복잡한 작업을 처리할 수 있게 했습니다.
핵심 포인트
- DiffusionGemma는 오픈소스로 공개되어 누구나 로컬에서 사용 가능합니다.
- 전통적인 자기회귀 방식 대신 확산(diffusion) 방식을 채택했습니다.
- 병렬 처리를 통해 텍스트 생성 속도를 획기적으로 높였습니다 (1000+ token/s).
- 코드, 수학 등 까다로운 작업 처리 능력이 뛰어납니다.
여러분, Google의 이 새로운 '모델'가 좀 흥미롭습니다!
DiffusionGemma는 텍스트 생성을 4배 속도로 끌어올렸을 뿐만 아니라 Apache 2.0으로 완전히 오픈소스를 공개하여 누구나 로컬에서 사용할 수 있게 했습니다.
이 모델은 전통적인 자기회귀(autoregressive) 방식의 '단어를 하나씩 내뱉고 다음 단어를 생각하는' 구식 방식을 사용하지 않습니다.
대신, diffusion을 이용해 먼저 노이즈 덩어리를 던진 후, 전체 블록 단위로 동시에 초안 작성, 동시에 오류 수정, 동시에 정제 작업을 수행하며 1000+ token/s의 속도로 폭발적인 성능을 보여줍니다.
18GB 소비자용 그래픽카드만으로도 원활하게 구동할 수 있으며, 코드, 수학, 복잡한 편집 등 가장 까다로운 작업들을 처리합니다.
현재는 실시간 빈칸 채우기, 포맷팅, 자체 복구 기능까지 가능하며, 속도가 너무 빨라서 AI가 '단어 하나하나를 끙끙거리는' 것이 아니라 '전체 문단을 생각하기 시작했다'고 느껴질 정도입니다.
이전에는 더 빠르려면 품질을 희생해야 한다고 모두가 당연하게 여겼지만, Google은 이번에 직접 알려줍니다: 병렬 diffusion이야말로 텍스트 생성의 다음 장이며, 전체 생성 패러다임을 순차적인 단어 생성에서 병렬적인 문장 정제(refinement)로 전환시켰다는 것입니다.
오픈소스 가중치(weights)는 이미 Hugging Face에 공개되었으며, 개발자들은 지금 바로 이 모델을 다운로드하여 자신만의 워크플로우를 수정하고, 가지고 놀고, 속도를 높일 수 있습니다.
이번 발표로 AI 생성 속도의 한계가 완전히 다시 쓰여질 수도 있을 것 같습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @berryxia (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기