NVIDIA מגדילה ל-150 מיליארד דולר בשנה בטייוואן ומתחילה משלוחי Vera CPU ראשונים

Jensen Huang הכריז ב-28 במאי ש-NVIDIA מגדילה את ההוצאה השנתית על ייצור ושרשרת אספקה בטייוואן מ-100 מיליארד דולר ל-150 מיליארד דולר, כדי לעמוד במה שתיאר כנקודת מפנה בביקוש ל-AI מונחה inference. ה-Vera CPUs הראשונים — ה-CPU מבוסס Arm של NVIDIA לדאטה סנטר, שמשודך ל-Rubin GPUs שלה — נשלחו למעבדות AI ולענני AI מובילים, עם זמינות רחבה צפויה במחצית השנייה של 2026. Huang הציף מסלול ל-3 טריליון דולר בהכנסות מצטברות שמונע על ידי עומסי inference agentic — מסגור בסדר גודל שנועד לאותת על כמה גדול NVIDIA חושבת ששוק ה-compute ל-inference יהפוך.
חשבון ה-X הרשמי של NVIDIA AI חשף ב-29 במאי טיזר 'A new era of PC' מקואורדינטות בטאיפיי — שנקרא בהרחבה כחשיפה ב-Computex 2026 של מכונת AI דסקטופ ברמת צרכן בסגנון Vera או DGX-Spark, אם כי NVIDIA לא אישרה פרטים. הפוסט נחת לצד חדשות שילוח ה-Vera CPU, מה שמרמז ש-NVIDIA דוחפת את stack ה-inference שלה למטה לעבר workstations של prosumers ומפתחים, לא רק לדאטה סנטרים של hyperscalers.
ההקשר התחרותי: ההתחייבות של 150 מיליארד דולר לטייוואן היא בחלקה הגנתית מול סיכון גיאופוליטי (ריכוזיות ב-TSMC) ובחלקה התקפית (נעילת קיבולת advanced packaging). שילוח ה-Vera CPU אומר ש-NVIDIA מציעה כעת stack משולב מלא של CPU+GPU שמתחרה ישירות יותר ב-AMD MI400 ובסיליקון המותאם של ספקי הענן (AWS Trainium, Google TPU, Microsoft Maia). NVIDIA גם הפיצה השבוע את DeepSeek V4-Pro בקוונטיזציית NVFP4 על Hugging Face — מה שמאשר את אסטרטגיית השותפויות שלה ל'אופטימיזציה ואחסון של כל מודל חשוב' ללא קשר לרעש גיאופוליטי.
מה לעקוב הלאה: benchmarks של Vera CPU מול AWS Graviton ו-Google Axion, האם מסגור הכנסות ה-inference של 3 טריליון דולר ישרוד קיצוצי מחיר בסגנון DeepSeek, ומה NVIDIA תכריז בפועל ב-Computex.