AzureMay 22, 20261 מקורות

Microsoft מבטלת את Claude Code פנימה — ה-tokens יקרים ממהנדסים

ניתוח AI

החידוש היום הוא מכניקת הדולרים: דיווח של Fortune מצביע על כך שעבור צוותים פנימיים רבים ב-Microsoft, חשבון ה-tokens החודשי על workflows agentic של Claude Code עלה על המשכורת המגולמת של המהנדסים שהשתמשו בו. ב-r/artificial הרימו את זה מיד (1,013 upvotes), והקונצנזוס ב-thread היה "זה הרגע שבו תמחור מבוסס-token פגש את המציאות של תקציב שנתי".

מכנית, התגובה של Microsoft היא מהלך של אינטגרציה אנכית. מהנדסים מועברים ל-GitHub Copilot CLI, שרץ על Azure OpenAI inference של Microsoft עצמה ומאפשר לחברה להפנים את המרג'ין במקום לשלם ל-Anthropic per token. Boris Cherny (ראש Claude Code ב-Anthropic) בילה את הסוף שבוע ב-X בקידום auto mode ו-workflows של multi-claude — הודאה משתמעת ש-Anthropic חייבת להניע יעילות או להסתכן בעוד נסיגות ארגוניות.

הקשר תחרותי: זה נוחת באותו שבוע ש-DeepSeek הפכה את הקיצוץ של 75% ל-V4-Pro לקבוע, Google הציגה חיסכון ארגוני של מיליארד דולר ב-Gemini, ומפתחים התלוננו ש-Anthropic ו-Google "מנרפות" מודלים בשקט כדי לשלוט בעלויות inference. החוט שמחבר הכל הוא ש-workloads agentic שורפים פי 10-100 tokens מ-workloads של chat, והתעשייה מגלה שכלכלת "החלפת אדם" בתעריף קבוע עוד לא משתלמת מבחינה חשבונית. בצד הצרכני, Microsoft גם עיצבה מחדש את Copilot כ-sidebar עגון ב-Windows 11 ולבסוף אפשרה למשתמשים להזיז את כפתור ה-Copilot הצף ל-ribbon אחרי חודשים של זעם ממשק. מה לעקוב: האם ארגונים גדולים אחרים (בנקים, חברות ייעוץ) יילכו בעקבות Microsoft, האם Anthropic תגיב עם רובדי תמחור ל-Claude Code או הנחות caching, והאם איכות GitHub Copilot CLI תחזיק מעמד תחת הזרימה. האות המאקרו הוא ש-2026 היא השנה שבה "עלות agent" הופכת למדד ברמת דירקטוריון.

מקורות

fortune.com

https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tokens-agents