Gemma 4 MTP 모델 출시

블로그 포스트:

https://blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/

MTP 드래프트 모델:

https://huggingface.co/google/gemma-4-31B-it-assistant

https://huggingface.co/google/gemma-4-26B-A4B-it-assistant

https://huggingface.co/google/gemma-4-E4B-it-assistant

https://huggingface.co/google/gemma-4-E2B-it-assistant

*이 모델 카드는 Gemma 4 모델용 멀티 토큰 예측 (MTP) 드래프트를 위한 것입니다. MTP 는 기본 모델을 더 작고 빠른 드래프트 모델로 확장하여 구현되었습니다. Speculative Decoding 파이프라인에서 사용할 때, 드래프트 모델은 여러 토큰을 앞서 예측하고, 타겟 모델이 병렬로 검증합니다. 이는 표준 생성과 동일한 품질을 보장하면서 상당한 디코딩 속도 향상 (최대 2 배) 을 가져옵니다. 따라서 이러한 체크포인트는 저 지연 및 온 디바이스 애플리케이션에 이상적입니다.

Insights

Gemma 4 MTP 모델 출시

요약

핵심 포인트

댓글

동결 후 선택: 희소 관측 데이터로부터의 PDE 발견을 위한 구조화된 필드 어댑터 및 안정성 검증된 약한 선택법

회귀 및 클러스터링에 적용 가능한 차분 프라이버시 기반 비매개변수 모드 학습 (Differentially Private

AI 어시스턴트와 함께 브라우저 확장 프로그램을 만들며 깨달은 실수들

승인은 불리언(Boolean)이 아니다: 에이전트가 재개될 때 여전히 유효해야 하는 것은 무엇인가?

동결 후 선택: 희소 관측 데이터로부터의 PDE 발견을 위한 구조화된 필드 어댑터 및 안정성 검증된 약한 선택법

회귀 및 클러스터링에 적용 가능한 차분 프라이버시 기반 비매개변수 모드 학습 (Differentially Private

AI 어시스턴트와 함께 브라우저 확장 프로그램을 만들며 깨달은 실수들

승인은 불리언(Boolean)이 아니다: 에이전트가 재개될 때 여전히 유효해야 하는 것은 무엇인가?