WSJ: Corporate America מתחילה לקצץ ב-AI כשהעלויות מרקיעות שחקים
הכתבה של The Wall Street Journal, 'Corporate America Is Starting to Ration AI as Cost Skyrockets', גיבשה את הנושא הדומיננטי של השבוע: הכלכלה של deployment של AI מתנגשת בתקציבים. הכתבה משכה 156 נקודות ו-150 תגובות ב-Hacker News והדהדה חזק אצל מפתחים שחותכים באופן פעיל את חשבונות הקוד שלהם.
הדיווח מתעד חברות שמטילות תקרות שימוש, גישה מדורגת ושערי אישור על כלי AI כש-token consumption — שמתעצם על ידי workflows מסוג agentic שמבצעים הרבה קריאות מודל לכל משימה — מעלה את העלויות מעבר לצפוי. זה מתחבר ישירות ל-thread ויראלי ב-r/ExperiencedDevs על חברה שמוציאה מיליון דולר בחודש על APIs של AI, ולכתבה שזכתה לשיתוף נרחב שמפרטת הורדה של 65% בחשבון ללא אובדן איכות באמצעות routing חכם יותר של מודלים.
נקודת הנתונים המעוררת ביותר הגיעה מ-thread ב-r/artificial (379 upvotes) שמצטט נתוני Microsoft שלפיהם AI יכול להיות יקר יותר מהעסקת אנשים עבור משימות מסוימות — אתגר ישיר לנרטיב הפרודוקטיביות שעליו מבוססות תוכניות ה-capex בסדר גודל של טריליון דולר בסקטור. המתח חד: NVIDIA מתחייבת ל-$100-150B בטייוואן על בסיס הנחה של ביקוש בלתי נדלה ל-inference, בעוד המשתמשים הסופיים מקצבים שימוש בו-זמנית. השאלה הלא-פתורה היא אם הירידה במחירי per-token (חיתוך של 75% ב-DeepSeek, ה-Grok Build הזול של xAI) תעקוף את צמיחת העלויות מקריאות agentic מרובות — או שהקיצוב יכופף את עקומת הביקוש שעליה NVIDIA מהמרת.