AWS מעלה מחירי GPU ב-EC2 בכ-20% ב-1 ביולי; מעבדי Graviton5 זמינים לכולם
העלאת מחירי ה-GPU בכ-20% ל-EC2 Capacity Blocks for ML היא ההעלאה השנייה בתוך חצי שנה (אחרי כ-15% בינואר), והיא לוחצת על תקציבי מחשוב ה-ML בדיוק כשעומסי agents מעלים את צריכת ה-tokens. instances מסוג P6-B300 נמצאים כעת ברשימה ב-14.04 דולר לשעה ו-P5 ב-5.19 דולר לשעה, כש-AWS מייחסת את ההעלאה למחסור בזיכרון ולחוסר איזון בין היצע לביקוש.
Graviton5, שהגיע לזמינות כללית באותו יום, הוא משקל הנגד: AWS טוענת לביצועים טובים יותר ב-25% ו-cache גדול פי 5 מ-Graviton4, ומקדמת יחס מחיר-ביצועים של CPU עבור עומסים שיכולים לעבור מ-GPU. AWS גם שחררה כלים — Continuum, Context ושיפורים ל-Amazon Quick agent — שמרחיבים את משטח תפעול ה-agents שלה.
תגובת הקהילה להעלאת מחירי ה-GPU הייתה תסכול: 'scale היה אמור לחסוך, זה כבר לא נכון', כשמפתחים מציינים שהנחות ארגוניות מבוססות-אחוזים נערמות כעת מול מרווחים דקים יותר. ההעלאה משתלבת בנושא כלכלת המחשוב של השבוע — Meta משכירה קיבולת בטלה, עסקאות חלוקת ההכנסות של NVIDIA, וה-pitch של inference זול יותר מ-Etched — כולם מגיבים לאותו לחץ של מחסור ב-GPU. הקריאה האסטרטגית היא ש-AWS דוחפת לקוחות לכיוון הסיליקון שלה עצמה (Graviton, Trainium) ככל שעלויות ה-GPU של צד שלישי מטפסות. שווה לעקוב אם העלאות מחירי ה-GPU יאיצו הגירה לחומרת inference חלופית.