מופעי Amazon EC2 G7 בזמינות כללית עם GPU מסוג NVIDIA RTX PRO 4500 Blackwell

AWS הפכה את מופעי Amazon EC2 G7 לזמינים באופן כללי, מופעלים על ידי GPUs מסוג RTX PRO 4500 Blackwell Server Edition של NVIDIA. מדדי AWS טוענים לשיפור של עד פי 4.6 בביצועי inference של AI ופי 2.1 בביצועי גרפיקה לעומת דור G6 הקודם, כשהמופעים מכוונים ל-inference serving, רינדור גרפי ועומסי analytics ולא לאימון בקנה מידה גדול.
המיקוד ב-inference אסטרטגי וחד: כפי שדיווח נפרד ציין, Nvidia מהדקת את אחיזתה דווקא בשוק ה-inference של AI — שלב הרצת המודלים הפרוסים שמייצר הכנסות — ו-G7 הוא AWS שמוכרת מחדש את היכולת הזו ללקוחות בקנה מידה. עבור צוותים שמריצים generative AI ב-production, הקפיצה הדורית חשובה כי עלות ה-inference היא החשבון החוזר שקובע אם פיצ'ר AI כדאי כלכלית.
ההשקה הגיעה בשבוע צפוף של AWS Summit לצד observability ל-inference ב-SageMaker AI (ביצועי token, בריאות GPU ונראות autoscaling ב-dashboard של CloudWatch), auto-scaling מהיר יותר ב-ECS באמצעות מדדים ברזולוציה גבוהה של 20 שניות, ומודלים חדשים ב-JumpStart כולל Ministral-3-14B של Mistral. ביחד אלה מסמנים ש-AWS מכפילה את ההימור על שכבת ה-inference ב-production — לא זוהרת אך קריטית.
המתח שכדאי לעקוב אחריו: AWS היא בו-זמנית הלקוחה הגדולה ביותר של NVIDIA (מוכרת מחדש את Blackwell דרך G7) וגם יריבה פוטנציאלית, כש-Bloomberg מדווחת ש-Amazon מנהלת מגעים למכור את שבבי ה-AI המותאמים שלה לחברות חיצוניות. התלות של G7 ב-NVIDIA מדגישה כמה רחוקה עדיין Amazon מהדחת שחקנית ה-GPU הוותיקה בדיוק בתחום שבו היא הכי רוצה לנצח.