DeepSeekJuly 2, 20262 מקורות

הגרסה המקדימה של DeepSeek-V4 מתמחרת פי 10 מתחת למתחרים — שמות ה-API הישנים נעלמים ב-July 24

ניתוח AI

התצוגה המקדימה של DeepSeek-V4 היא זעזוע תמחורי. השורה משלבת את V4-Pro (1.6T פרמטרים, 49B מופעלים) עם V4-Flash (284B פרמטרים, 13B מופעלים), שניהם מציעים חלון context של מיליון tokens שמתאפשר בזכות DSA sparse attention. המספר שחשוב: V4-Flash ב-$0.28 למיליון output tokens, בערך פי 10 זול יותר מהמודלים המובילים המערביים — ולפי השוואות מסוימות זול בכ-97% מ-GPT-5.5.

תפעולית, DeepSeek מתקננת את חלון ה-context של מיליון tokens על פני כל השורה ומכניסה תמחור API של שעות שיא/שפל (חיוב כפול בשעות העומס) כדי לנהל עומס — דרך חדשנית לעצב ביקוש. שמות המודלים הישנים deepseek-chat ו-deepseek-reasoner יוצאים משימוש ב-24 ביולי, מה שכופה מיגרציה, וההשקה המלאה של V4 צפויה באמצע יולי.

תגובת המפתחים הייתה עזה. שרשורים ב-r/DeepSeek כמו 'Switched to Open Code. DeepSeek v4 flash is the king' (155 upvotes) ושאלות על חיווט V4 לתוך Claude Code ו-VS Code מסמנים מומנטום אימוץ אמיתי בקרב בונים רגישי-עלות. הוויכוח: האם התמחור בר-קיימא מבנית או loss-leader טקטי לתפיסת נתח שוק. ההקשר התחרותי: V4 הוא קצה החוד של מתקפת עלות סינית רחבה יותר (ראו GLM-5.2 שאומן בכ-$25M על silicon של Huawei) שלוחצת על כוח התמחור של חברות ה-AI המערביות — לחץ ש-Sonnet 5 של Anthropic ב-$2/M ו-OpenAI חייבות כעת לענות עליו. הסתייגויות: תמחור output זול לא לוכד פערי איכות, וחששות גיאופוליטיים/אבטחה (שמהדהדים באיסור של Alibaba על Claude Code ובאזהרות על הטיה בקוד של מודלים סיניים) מסבכים אימוץ ארגוני. מה לעקוב: benchmarks עצמאיים של קידוד והאם התמחור של V4 יחזיק אחרי GA.

מקורות

technode.com

https://technode.com/2026/06/30/deepseek-to-launch-v4-in-mid-july-with-new-peak-time-api-pricing

waytoclawearn.com

https://waytoclawearn.com/news/deepseek-api-model-name-deprecation-july-2026-migration