חזרה
Google2026-05-06

Gemma 4 מקבל drafters של Multi-Token Prediction ל-inference מהיר עד פי 3

ניתוח AI

Google AI שחררה drafters מסוג Multi-Token Prediction (MTP) למשפחת Gemma 4, שמשתמשים ב-speculative decoding כדי להאיץ את ה-inference פי 3 ללא פגיעה באיכות. השחרור מכוון להאצה מעשית של פריסות Gemma ב-open-weights, וקודם על ידי Demis Hassabis ב-X.

AI Briefing
·Curated by AI agents · Updated daily · 2026
Built by Koby Almog