OtherMay 20, 20261 מקורות

AMD ו-Dell: agentic AI כותב מחדש את כלכלת ה-compute הארגונית

ניתוח AI

ב-Dell Tech World ב-20 במאי, AMD ו-Dell עשו במשותף את הטיעון ש-workloads של agentic AI מאלצים גל שני של שיפוץ תשתיות ארגוניות — נפרד מהגל הראשון של 'שים cluster של GPUs בדאטה-סנטר'. הסיקור של SiliconANGLE התרכז במסגור 'מפעל AI': ארגונים מתכננים כעת קיבולת סביב throughput מתמשך של tokens, לא סביב משימות training בשיא, וזה משנה איזה compute זול ואיפה הוא צריך לשבת.

לטיעון יש שתי רגליים טכניות. ראשית, כלכלת tokens: workflows אגנטיים מייצרים סדרי גודל יותר קריאות inference מאשר צ'אט (מנהל ב-Dell ציטט עלייה של פי 320 בצריכת tokens לכל workload), מה שהופך עלות-לכל-token של inference למשתנה התכנון הדומיננטי, לא FLOPs של training. שנית, כובד הדאטה: agents צריכים לפעול על דאטה ארגוני חי — SAP, Salesforce, מסדי נתונים פנימיים — והעברתו לאזור hyperscaler יקרה ויותר ויותר נתקלת במגבלות רגולטוריות. ארכיטקטורות היברידיות מבוזרות עם inference on-prem או ב-edge הופכות להיות רציונליות כלכלית, לא רק מונעות-ציות.

זה גם פיץ' תחרותי נגד stacks של NVIDIA-טהורה. AMD ממצבת את מאיצי ה-MI שלה כמהלך 'כלכלת inference', ואת Dell כשותף האינטגרציה שהופך היברידי לפריס בפועל. זה משתלב עם שני סיפורים נוספים השבוע: Zyphra שמגייסת 500 מיליון דולר כדי לאמן מודלים כולם על חומרת AMD, ו-Dell שהופכת לערוץ ה-on-prem של OpenAI למודלי frontier (לצד הפיץ' של Microsoft ל-Azure Local / Foundry Local).

הקריאה הסקפטית היא שמסגור 'מפעל AI' הוא בעיקרו עטיפה שיווקית סביב מגמה אמיתית אבל לא זוהרת: inference בקנה מידה הוא ה-workload שמשלם, ומי שמוכר את ה-token הזול ביותר מנצח. הצפי של NVIDIA לצמיחת הכנסות של 95% באותו יום מרמז שמונופול ה-GPU עדיין שריר וקיים בשכבת ה-training. השאלה המעניינת היא אם AMD-פלוס-Dell-פלוס-היברידי באמת יכולים לסגור את פער כלכלת ה-inference מהר מספיק כדי לקחת נתח משמעותי לפני ש-Rubin יוצא לשוק.

מקורות

siliconangle.com

https://siliconangle.com/2026/05/20/hybrid-ai-architecture-agentic-workloads-scale-delltechworld/