4 חודשים, תקציב שנתי שרוף: ככה Claude Code פוצץ את התחזיות של Uber
הסיפור של Uber ו-Claude Code הוא ה-case study התפעולי שהשיחה על AI ארגוני חיכתה לו. לפי הדיווח של Energy News Beat, Uber פרסה את Claude Code של Anthropic ברוחב ארגון ההנדסה שלה ושרפה את כל תקציב ה-AI השנתי שלה תוך כארבעה חודשים. המנגנון פשוט: סשנים ארוכי-טווח של agentic coding שורפים הרבה יותר tokens מאשר שימוש בסגנון צ׳אט, וחיוב לפי tokens מתרחב לינארית (או גרוע מזה) ככל שמהנדסים משתמשים בכלי באגרסיביות.
הסיפור חשוב כי הוא שם מספרים מאחורי תלונה שמפתחים ו-CFOs משמיעים בשקט כבר חודשים. Source D מציין ש-OpenRouter יותר מהכפילה את עצמה לשווי של 1.3 מיליארד דולר תוך שנה — הצבעה ישירה בארנקים לטובת multi-model routing כשכבת בקרת עלויות. ה-thread הוויראלי ב-r/ClaudeAI על חברה שמפרסמת לוחות תוצאות שבועיים של מי שורף הכי הרבה tokens של Claude Code Sonnet 4.6 (758 upvotes, 393 תגובות) הוא אותה חרדה מצד המפתחים: כשצריכה לא מוגבלת וגלויה, התנהגות משתנה.
מבנה התמחור הוא הסיפור האמיתי. הצעת הערך של Claude Code היא שמהנדס יכול למסור ל-agent משימה של כמה שעות וללכת — אבל עלות ה-tokens של האוטונומיה הזו היא בדיוק המשתנה ש-FP&A ארגוני לא יכול למדל. צוותי procurement שגדלו על תמחור per-seat של SaaS מתמודדים עכשיו עם מודל שבו ההוצאה החודשית של מהנדס בודד יכולה לנוע פי 10-50 לפי דפוסי השימוש ב-agent. Anthropic, OpenAI ו-Google כולן התחילו לשלוח prompt-caching כברירת מחדל ותוכניות ארגוניות מדורגות, אבל אף אחת עדיין לא הציעה את תקרת ה-per-seat הצפויה שארגוני פיננסים באמת רוצים.
מה לעקוב: האם Anthropic תגיב עם בקרות תקציב ארגוניות מפורשות וסכרים קשיחים בתוך Claude Code, האם לקוחות בסדר גודל של Uber יתחילו לדרוש תמחור היברידי (רצפת per-seat + גלישה מדודה), והאם הפחתות מחיר של 75% בסגנון DeepSeek יאלצו את מעבדות ה-frontier לחשיבה מבנית על תמחור ולא לרק הנחות פרומו. המספר של Uber הולך להיות מצוטט בכל שיחת procurement של AI ארגוני עד סוף 2026.