Microsoft בוחנת DeepSeek V4 ל-Copilot Cowork כדי לבלום עלויות 'tokenmaxxing'

לפי Axios, Microsoft שוקלת גרסת fine-tune של DeepSeek V4 הסיני כדי להפעיל את Copilot Cowork, מוצר הפרודוקטיביות ה-agentic שלה שהפך זה עתה לזמין לכולם. המניע הוא כלכלה בוטה: agents שרצים לאורך זמן ושורפים tokens במשימות מורכבות ורב-שלביות הקפיצו את עלויות המחשוב לרמות לא נוחות — מה שהקהילה כינתה 'tokenmaxxing' — והארכיטקטורה היעילה-תחילה של DeepSeek מציעה inference זול דרמטית מהמודלים של OpenAI ו-Anthropic שמאחורי Copilot כיום.
בעיית העלות אמיתית ומורגשת אצל המשתמשים. ב-Reddit דווח שסשן coding agentic יחיד ב-Copilot שרף 30–40 דולר בקרדיטים — פי שלושה עד ארבעה מההקצאה החודשית הכוללת של מנוי Pro — ועורר זעם ש-Microsoft 'בונה פיצ'רים שמעודדים צריכת token גבוהה, ואז מענישה את המשתמשים'. התגובה הזו, יחד עם החיוב החדש מבוסס-הצריכה של Copilot Credits, הופכת מודל בסיס זול יותר לאטרקטיבי אסטרטגית.
מכאנית, Microsoft תעשה fine-tune למודל DeepSeek V4 open-source (או דומה) ותתאים אותו לעומסי עבודה ספציפיים ב-Cowork, במקום לנתב את הכול דרך מודלים מובילים יקרים — תוך שמירת המודלים היקרים למשימות שבאמת זקוקות להם. Satya Nadella כבר התרברב בזמינות הכללית של Copilot Cowork 'עם תמיכה במולטי-מודל', אות לכך שהארכיטקטורה בנויה להחליף מודלים לפי משימה.
הסיבוך המתבקש הוא גאופוליטיקה. אימוץ מודל סיני — גם אם מודל פתוח שרץ על התשתית של Microsoft עצמה — 'כנראה למורת רוחו של Trump', כפי שניסחה זאת Gizmodo, מזמין ביקורת בדיוק כשוושינגטון מגבילה את המודלים של Anthropic ושוקלת (ואז נמנעת) מלהכניס את DeepSeek לרשימה שחורה. הפרק מגביש את המתח המרכזי של 2026: מודלים סיניים פתוחים מציעים חיסכון במחשוב גדול מכדי להתעלם, אבל השימוש בהם נושא סיכון פוליטי לשחקנים האמריקאיים הוותיקים. שווה לעקוב אם Microsoft תתקדם ואיך תמסגר את הטיפול בנתונים והאבטחה אם כן.