ההגמוניה של NVIDIA נבחנת: OpenAI משיקה שבב inference ראשון בייצור Broadcom

טרנד 'בנו את הסיליקון שלכם' הגיע לאבן דרך חדשה כש-OpenAI השיקה את ה-chip הראשון לפיתוח עצמי ל-AI inference, דרך שיתוף פעולה עם Broadcom. כך היא מצטרפת ל-AWS Trainium ולמאמצי custom נוספים שמאתגרים את אחיזת החומרה של NVIDIA. המהלך מעצים ויכוח ותיק על עד כמה עמדתה של NVIDIA באמת יציבה, כשהלקוחות הגדולים ביותר שלה מתכננים חומרה משלהם.
NVIDIA מגיבה בקנה מידה: היא התחייבה ל-119 מיליארד דולר באספקה והוסיפה 80 מיליארד דולר לתוכנית רכישת המניות שלה — אותות לביטחון בביקוש מתמשך. מפת הדרכים שלה ל-co-packaged optics (CPO) ממצבת את טכנולוגיית COUPE של TSMC לתשתית AI מהדור הבא, ומטפלת בצווארי הבקבוק של רוחב פס וצריכת חשמל שמגדירים אשכולות training ו-inference בקנה מידה גדול.
הניואנס התחרותי הוא תוכנה, לא רק סיליקון. Cerebras גייסה 5.6 מיליארד דולר ב-IPO על בסיס מהירות ה-inference הגולמית של LLM, אך — כפי שניסח זאת ניתוח אחד — היא עדיין 'נופלת לתוך מלכודת התוכנה הענקית של NVIDIA', כבולה ל-ecosystem של CUDA למרות חומרה מהירה יותר. זה לוכד את השאלה המרכזית שמפתחים מתחבטים בה: כמה זמן תחזיק חפירת ההגנה של CUDA מול חומרה מתחרה שהיא באמת מהירה יותר?
במהותו זהו המשך של נושא השקעות המחשוב וגיוון החומרה של השנה, כשהעובדות הקונקרטיות החדשות הן ה-chip של OpenAI מבית Broadcom שיוצא לשוק, נתוני 119 מיליארד הדולר באספקה ו-80 מיליארד הדולר ברכישת מניות של NVIDIA, ופרט מפת הדרכים של COUPE. ספקנים מציינים ש-chips ל-inference בעיצוב custom מקלים על לחצי עלות ואספקה, אך לעיתים רחוקות מדיחים את NVIDIA מ-training, שם יתרון ה-ecosystem שלה הוא הרחב ביותר. מה לעקוב אחריו: benchmarks מהעולם האמיתי של ה-chip של OpenAI, והאם ניידות תוכנה תשחק את התלות ב-CUDA.