DeepSeek V4 Flash מזניקה את סין לראש צריכת ה-token העולמית
נתוני שימוש חדשים שצוטטו ב-NDTV Profit ממקמים את DeepSeek V4 Flash בראש צריכת המודלים העולמית עם 4.63 טריליון token, נתון שמעגן נרטיב רחב יותר: סין נטלה את הכתר בשימוש token עולמי ב-AI, ועקפה את היריבות האמריקאיות במחיר ובמרווחים. המנוע הוא העלות — DeepSeek ועמיתות כמו MiniMax נהנות מאנרגיה מקומית זולה יותר ומארכיטקטורות מודל יעילות באגרסיביות, מה שמאפשר להן להציע inference במחירים ש-חברות ה-AI האמריקאיות מתקשות להשתוות אליהם.
ה-V4 Flash הוא השכבה הממוטבת-עלות במשפחת V4 של DeepSeek, מכווננת ל-serving בתפוקה גבוהה ובעלות נמוכה במקום ליכולת מקסימלית. הדומיננטיות שלו בנפח ה-token הגולמי משקפת כמה מעומס העבודה האמיתי הוא inference מסחרי רגיש-מחיר ולא reasoning מוביל.
הנתונים נוחתים באותו שבוע שבו DeepSeek סגרה סבב גיוס של כ-7.4 מיליארד דולר בשווי של 50+ מיליארד דולר, וארה"ב לפי הדיווחים נמנעה מלהכניס את החברה לרשימה השחורה. עבור השחקנים המערביים הוותיקים, האות לא נוח: OpenAI לפי הדיווחים שוקלת 'הורדות מחיר דרסטיות' בציפייה למלחמת מחירים, ונתוני נתח ה-token מרמזים שהקצה הנמוך של השוק כבר נוטה לכיוון מודלים סיניים פתוחים ומתארחים. יש הסתייגויות — ספירות token מודדות נפח, לא הכנסה או ערך, והמתודולוגיה מאחורי ספירות token חוצות-ספקים רחוקה מלהיות שקופה.