Gemma 4 של Google נוחתת על Amazon Bedrock — open-weight תחת Apache 2.0

משפחת המודלים הפתוחים Gemma 4 של Google DeepMind זמינה כעת לכלל המשתמשים על גבי Amazon Bedrock תחת רישיון Apache 2.0 המתירני — אחת ההכרזות הבולטות בכנס AWS Summit בניו יורק. ההשקה כוללת שלושה וריאנטים מכווננים לפי הוראות (instruction-tuned): Gemma 4 31B, תצורת Mixture-of-Experts בגודל 26B-A4B, ו-E2B קומפקטי — כל אחד מכוון לאינטליגנציה גבוהה לכל פרמטר, כך שלקוחות יכולים להתאים את גודל המודל לעומס העבודה ולתקציב.
בחירת הפצה ראויה לציון: העובדה ש-Google מציבה את המודלים הפתוחים שלה באופן נייטיב על הענן של Amazon מדגישה שינוי בשוק — מעבר משותפויות בלעדיות לעבר marketplace מרובה-מודלים, שבו לקוחות בוחרים מודלים מובילים ומודלים פתוחים לפי התאמה ולא לפי נאמנות לספק. באותו שבוע, GPT-5.5 ו-Codex של OpenAI הגיעו לזמינות כללית על Bedrock, ו-DiffusionGemma הקוונטיזי של NVIDIA נחת ב-Hugging Face — מה שמחזק את התמונה שספקיות הענן הגדולות מתחרות על אירוח הקטלוג הרחב ביותר של מודלים, עם בקרות אבטחה וממשל נייטיביות.
וריאנט ה-MoE בגודל 26B-A4B — שבו רק חלק קטן מהפרמטרים פעיל לכל token — מכוון בדיוק לדאגת היעילות-לכל-דולר ששלטה בשיח המפתחים השבוע, כשצוותים מגיבים לעלויות inference משתוללות במודלים סגורים מובילים. רישיון Apache 2.0 הופך את Gemma 4 לאטרקטיבי ל-fine-tune מסחרי ול-deploy on-prem, וממצב אותו מול Mistral, Qwen ו-DeepSeek בשכבת המודלים הפתוחים. שווה לעקוב אחר benchmarks עצמאיים שישוו את Gemma 4 ליריבים האלה, ועד כמה אגרסיבית ארגונים יאמצו אותו כתחליף זול למודלים סגורים מוגבלים.