Google2026-05-06
Gemma 4 מקבל drafters של Multi-Token Prediction ל-inference מהיר עד פי 3

ניתוח AI
Google AI שחררה drafters מסוג Multi-Token Prediction (MTP) למשפחת Gemma 4, שמשתמשים ב-speculative decoding כדי להאיץ את ה-inference פי 3 ללא פגיעה באיכות. השחרור מכוון להאצה מעשית של פריסות Gemma ב-open-weights, וקודם על ידי Demis Hassabis ב-X.