Google DeepMind הוציאה ל-release את Gemma 4: מודלים multimodal בעלי משקל פתוח הפועלים על GPU H100 יחיד עם תמיכה ב-140+ שפות

Google DeepMind השיקה את משפחת Gemma 4, ארבעה מודלים ממוקדי קוד פתוח ממוקדי קוד מרובי-מצבים (ברישיון Apache 2.0) שנבנו לרוץ לחלוטין על יחידת Nvidia H100 GPU יחידה של 80GB תוך הספקת ביצועים תחרותיים על בנצ'מארקים על פני קלט תמונה, טקסט ואודיו. המשפחה כוללת את מודל Mixture-of-Experts הראשון של Gemma, תומכת בלמעלה מ-140 שפות, והיא מיטבת לתכנון, קידוד, זרימי עבודה של סוכנים וקריסת התקנים מטלפונים חכמים למערכות IoT - הפחתת איחור ותלות בענן. שוחררה בו-זמנית ב-Hugging Face עם וריאנטים מיטבים של NVIDIA, Gemma 4 נכנסה לשדה מודל פתוח צפוף לצד Llama 4 Scout של Meta (הקשר של 10M token), Qwen 3.6-Plus של Alibaba (הקשר של 1M token), DeepSeek ואחרים. מפתחים יכולים גם להפעיל Gemma 4 באופן מקומי באמצעות ממשק CLI headless של LM Studio, זרימת עבודה שהרוויחה 310 נקודות ב-Hacker News.