מיליון GPU במקום אחד: xAI מפעילה את Colossus 2 ומאמנת את Grok 5

ב-xAI אומרים ש-Colossus 2 הוא ה-supercluster הראשון בעולם עם כמיליון GPU — בערך 1.02 מיליון NVIDIA GB300 GPUs מפוצלים בין אתרים ב-Memphis וב-Atlanta, שצורכים 1.4GW של הספק כולל ומשתמשים בקירור נוזלי של 140kW לכל rack. מדווח ש-Grok 5 נמצא כעת ב-pre-training על ה-cluster, עם השלמה צפויה עד אוגוסט 2026.
קנה המידה הוא קפיצת מדרגה במרוץ החימוש של כוח המחשוב. מהנדסים שהגיבו ברשת כינו זאת 'היום שבו העקומה התעקלה שוב', והמהלך מדגיש את האסטרטגיה של Elon Musk לבנות יותר מהמתחרות בתשתית גולמית. Anthropic הגיבה לפי הדיווחים תוך שעות עם הרחבת צי Amazon Trainium בהיקף $12B, מה שמסמן שהתחרות בין חברות ה-AI המובילות הופכת יותר ויותר למאבק על מי שיכול להקים את הכי הרבה accelerators הכי מהר.
ה-buildout גם מעלה שאלות קשות על הספק ומיקום: 1.4GW דומה לתפוקה של תחנת כוח גרעינית גדולה, וההרחבה המהירה של xAI ב-Memphis כבר משכה ביקורת על השפעות על רשת החשמל המקומית ועל הסביבה. האם Grok 5 יספק קפיצת יכולת מתאימה — והאם יתרון ההפצה של xAI דרך Tesla ו-X יוכל למנף אותו לכסף — נותרת השאלה הפתוחה כשיעד ה-training של אוגוסט מתקרב.