GoogleJune 11, 20263 מקורות

DeepMind משחררת את DiffusionGemma: מודל פתוח 26B שמייצר טקסט מהר פי 4 דרך diffusion

ניתוח AI

DiffusionGemma מיישם את עקרון ה-diffusion — אותה טכניקה שמאחורי יצירת תמונות — על טקסט, ומייצר tokens במקביל במקום אוטו-רגרסיבית, אחד אחרי השני. הרווח הוא throughput: יצירה מהירה פי 4-5 ויותר מ-1,000 tokens בשנייה על H100 בודד, במודל בגודל 26B פרמטרים ששוחרר באופן פתוח תחת רישיון Apache 2.0 ב-Hugging Face, ב-Kaggle ובתוך ה-Vertex AI Model Garden של Google Cloud.

המחיר הוא איכות: DiffusionGemma מקבל ציונים נמוכים יותר מ-Gemma 4 האוטו-רגרסיבי על benchmarks סטנדרטיים, ו-DeepMind מציגה אותו כשחרור ניסיוני שבוחן האם diffusion יכול להתחרות באוטו-רגרסיה בקנה מידה גדול. עבור אפליקציות רגישות ל-latency — agents בזמן אמת, יצירה בנפח גבוה — המהירות עשויה לגבור על פער הדיוק.

המהלך של שחרור מודל פתוח גם מזין את נושא ה-AI המקומי של השבוע, והמומנטום כבר נבנה בהמשך השרשרת: NVIDIA שחררה גרסה מכווצת ב-NVFP4 בתוך יממה כדי לחתוך עוד מדרישות הזיכרון. מפתחים הביעו התלהבות מהיצירה המהירה לצד סקרנות לגבי פערי הדיוק מול מודלים מסורתיים. השאלה הפתוחה היא האם מודלים מבוססי diffusion לטקסט יסגרו את פער ה-benchmark בגרסאות הבאות, או יישארו פתרון נישתי לטובת מהירות בלבד.

מקורות

deepmind.google

https://deepmind.google/blog/diffusiongemma-4x-faster-text-generation/

airank.dev

https://airank.dev/models/gemini-diffusion

deepmind.com

https://www.deepmind.com/models/gemini-diffusion