NVIDIA קופצת ב-79% — ו-AMD זורקת mini-PC של 4,000 דולר ישר מול DGX Spark
הדוח של Nvidia לרבעון הראשון של FY27 מאריך רצף של רבעונים מנצחים, אך עם נרטיב שונה משמעותית: אנליסטים בשיחה לחצו על נתח inference, רוחות נגד במדיניות סין, והאם capex של מעל טריליון דולר בתעשיית AI הוא בר-קיימא. הרווח המתואם הגיע ל-42.97 מיליארד דולר, עלייה של 81.8%, והמעבר מ-training ל-inference ש-Huang תיאר מתיישב עם דיווחי תעשייה רחבים יותר (נאומי המפתח של AWS Summit Seoul 2026; הציוץ של Greg Brockman על חוזי קיבולת ארוכי טווח). ניתוח נלווה ב-Medium דחה בתקיפות את מסגור הבועה, וטען שכלכלת היחידה לפי token מצדיקה את ההוצאה באופן ש-dark fiber של סוף שנות ה-90 מעולם לא הצדיק.
באותו יום, AMD פירטה את פלטפורמת Ryzen AI Halo — דסקטופ בגודל 6x6 אינץ' עם 128GB של זיכרון מאוחד במחיר 3,999 דולר — שנוחת בדיוק על מחיר ה-DGX Spark של Nvidia. r/LocalLLaMA רעשה: thread מוביל (220 upvotes) מסגר זאת כאלטרנטיבה אמינה ראשונה ברמת enthusiast ל-DGX עבור inference מקומי במחלקת 70B. הפיץ' של AMD הוא קיבולת RAM לעומסי עבודה agentic עם הקשר ארוך, חוד תקיפה לתוך רובד ה-AI on-device ש-Nvidia שלטה בו דרך השיווק של RTX AI PC.
Nvidia גם הרחיבה לתחום הפארמה עם שותפות Qiagen BioNeMo לגילוי תרופות, ובשקט שחררה את Nemotron-Labs-Diffusion, language model בעל שלושה מצבים שתומך בפי 6 tokens מגרסאות Nemotron קודמות, לצד המודל המכווץ Kimi-K2.6-NVFP4 ב-Hugging Face ל-inference מוכן לפריסה ב-NVFP4. מה לעקוב אחריו: האם ה-Halo של AMD יקבל אחיזת enterprise משמעותית או יישאר כסקרנות לחובבנים; האם ההערות של Huang על סין יעוררו תגובת מדיניות בטווח הקרוב; והאם נרטיב נתח ה-inference יופיע בחשיפות mix קונקרטיות של GPU מספקי ענן ברבעון הבא. סקפטיקנים עדיין מצביעים על סיכון קונים מרוכז (hyperscalers) ושואלים מה יקרה כש-capex של מעבדות frontier יתנרמל סוף סוף.