רבעון שיא ל-NVIDIA: 81.6 מיליארד דולר, מעבדי Vera וארונות Vera Rubin ב-7.8 מיליון דולר

הדוח של NVIDIA על 81.6 מיליארד דולר ב-Q1 הוא נקודת הנתונים הבודדת והנקייה ביותר שיש לנו על מחזור ה-capex של AI. החברה גם ביטלה בשקט את קטגוריית הכנסות ה-Gaming מהדוחות הפיננסיים — הודאה מבנית בכך ש-data-center האפיל לחלוטין על GPUs צרכניים עד שסעיף נפרד כבר לא אינפורמטיבי. ב-r/LocalLLaMA שמו לב (751 upvotes, 224 תגובות) וקראו את זה כאישור ש-NVIDIA היא כעת חברת תשתיות AI טהורה.
מכנית, השלב הבא הוא מעבדי Vera ו-racks של Vera Rubin. אנליסטים מצפים להדגמות ב-Computex Taipei שיציגו את Vera בביצועים גבוהים פי 1.5 בערך מ-x86 של Intel/AMD ב-workloads של inference agentic, מה שיהפוך את NVIDIA לספק host-CPU אמין בפעם הראשונה. ההערכה של Morgan Stanley על 7.8 מיליון דולר ל-rack, מתוכם מעל 2 מיליון דולר רק על memory, מתיישבת עם הממצא של Epoch AI (313 נקודות HN, 340 תגובות) ש-memory מהווה כעת קרוב לשני שלישים מעלויות הרכיבים של שבבי AI — צוואר הבקבוק עבר מ-FLOPS ל-HBM bandwidth.
הקשר תחרותי: Corsair השיקה תחנות עבודה של AI מבוססות Grace Blackwell GB300 בד בבד עם דוח הרווחים, מה שמרחיב את ההגעה של NVIDIA לרובד הפרוסומר בדיוק כשגיימרים מתלוננים ב-r/nvidia (1,224 upvotes ב-thread של "Upgrade path") שערך ה-GPU מתעוות עקב ביקוש AI. במקביל, עסקת ה-compute של xAI–Anthropic וביטול Claude Code על ידי Microsoft מחזקים את התובנה שלקוחות NVIDIA מוציאים כעת יותר על tokens אחד של השני מאשר על רישיונות אחד של השני. מה לעקוב: אילוצי היצע של HBM (Samsung/SK Hynix הם נקודת החנק), האם Vera תיוצא בלוח הזמנים, והאם המחיקה המשתמעת של סגמנט ה-Gaming תופיע ב-guidance של הרבעון הבא. עבור בונים, ההשלכה המעשית היא ש-memory bandwidth — לא TFLOPS — צריך להניע את החלטות הארכיטקטורה של ה-inference שלכם ב-12 החודשים הקרובים.