חשבונות ה-AI המנפחים דוחפים עסקים למודלים פתוחים וסיניים זולים

Reuters מדווח שזינוק עלויות ה-AI מעצב מחדש באופן יסודי את האופן שבו עסקים בוחרים מודלים, ודוחף אותם לעבר open-source וחלופות סיניות זולות יותר. ארבעת המודלים הפופולריים ביותר ב-OpenRouter הם כעת כולם סיניים, כש-DeepSeek מחזיקה במקום הראשון — היפוך מרשים של דומיננטיות המודלים האמריקאיים מלפני שנה.
הכלכלה חדה: מודלים סיניים גובים מעט כמו 18 סנט למיליון tokens מול כ-4 דולר בממוצע למודלים אמריקאיים — פער של יותר מפי 20 למשימות שגרתיות. Gartner מוסיף אזהרה צופה פני עתיד שלפיה עלויות כלי AI-coding עשויות לעלות על שכרו של מפתח עד 2028 אם המגמות הנוכחיות יימשכו, מה שלוחץ על צוותים לעבר model routing, caching ו-backends זולים יותר.
זו התמה המקשרת שמחברת חלק גדול מחדשות השבוע: Meta שנותקה מ-Gemini של Google בגלל צריכת-יתר, Anthropic ו-Amazon שמתעמתות על חיוב מבוסס-tokens, Uber שלפי הדיווחים שרפה את תקציב ה-AI שלה ל-2026 בארבעה חודשים, ו-Apple שמגלגלת עלויות שבבים על הצרכנים. עלות — לא רק יכולת — היא כעת משתנה ההחלטה הדומיננטי.
עבור חברות ה-AI המובילות האמריקאיות, השילוב של מחירים גבוהים וגישה מאחורי שער ממשלתי מוסר בפועל נתח שוק למודלים סיניים פתוחים. הספקנים מזהירים מפני סיכוני data-governance, compliance וסיכונים גאופוליטיים בניתוב workloads של ייצור דרך מודלים סיניים, ומציינים שה-token הזול ביותר אינו תמיד התוצאה הזולה ביותר ברגע שמתמחרים איכות ואמינות. מה לעקוב: האם ספקים אמריקאיים יחתכו מחירים בתגובה, וכיצד ארגונים יאזנו בין עלות ל-compliance.