DeepSeekMay 20, 20261 מקורות

DeepSeek V4 Flash ו-V4 Pro יוצאים עם שכבת agentic-coding בגודל 1.6 טריליון פרמטרים

ניתוח AI

DeepSeek V4 הוא השחרור הראשון של החברה שמאמץ במפורש מבנה דו-שכבתי, נטישת גישת המודל-בסיסי-יחיד של V3 לטובת פיצול Flash/Pro שכבר אומץ ע"י Anthropic (Claude Haiku/Sonnet/Opus), OpenAI (mini/standard/pro) ו-Google (Flash/Pro). V4 Flash הוא MoE עתיר-תפוקה שנבנה ל-batch inference, ללולאות agent עם הרבה tool calls בעלי סיכון נמוך, ולפייפליינים רגישי-עלות. V4 Pro, עם 1.6T פרמטרים סה"כ, מכוון לקצה ההפוך: reasoning ארוך-טווח, agentic coding מורכב, ומשימות ניתוח שבהן עלות ה-token משנית לאיכות התוצאה.

מבחינה ארכיטקטונית, שני המודלים יורשים את ה-MoE החתום של DeepSeek ואת המשמעת האגרסיבית בעלויות אימון. החברה לא פרסמה benchmark מלא בהשקה, אך היסטורית DeepSeek משחררת מודלים שמגיעים ל-5-10% מהמעבדות האמריקאיות החזיתיות במחיר נמוך משמעותית — דינמיקה ששינתה את לחצי התמחור בכל התעשייה ב-18 החודשים האחרונים.

הקשר תחרותי: V4 נוחת בשבוע שנשלט ע"י Google I/O וחדשות ארגון-מחדש בענן של OpenAI, מה שעלול לדלל תשומת לב אבל גם משקף את המיצוב של DeepSeek — היא מתחרה על price-per-token ואמון מפתחים, לא על מחזורי PR. שחרור Qwen3.7 המקביל של Alibaba (Max-Preview במקום 13 ב-LM Arena לטקסט, Plus-Preview במקום 16 ל-vision) מראה שהחזית הסינית פעילה גם כשתשומת הלב הרגולטורית בארה"ב במקום אחר. ספקנות: 1.6T פרמטרים ב-V4 Pro מעלים שאלות עלות-inference למארחים עצמיים, ופיצול Flash/Pro מסכן את חוויית המפתח שהפכה את DeepSeek לאטרקטיבית מלכתחילה. שווה לעקוב אחר benchmarks עצמאיים בשבועיים הקרובים, זמינות hosting ב-Together/Fireworks/Hyperbolic, והאם NVIDIA תשחרר גרסה מקוונטטת ב-NVFP4 (כפי שעשתה השבוע ל-Kimi-K2.6 של Moonshot).

מקורות

openrouter.ai

https://openrouter.ai/deepseek/deepseek-v4-pro