DeepSeek2026-04-27

תצוגה מקדימה של DeepSeek V4: 1.6T MoE, 1M context, Apache 2.0 — וצעד לכיוון Huawei Ascend

ניתוח AI

DeepSeek חשפה גרסת preview של V4-Pro-Max (1.6T פרמטרים) ו-V4 Flash (284B) — מודלי MoE עם חלון של 1M tokens, open-weighted תחת Apache 2.0, בתמחור API של $1.74/$3.48 למיליון tokens. השחרור מציג Compressed Sparse Attention יחד עם Heavily Compressed Attention, שחותכים את ה-KV cache פי ~10 בהקשר של 1M ומשתמשים רק ב-27% מ-FLOPs של inference לכל token לעומת V3.2. חשוב לא פחות — DeepSeek הוכיחה שניתן להריץ fine-grained Expert Parallelism על Huawei Ascend NPUs בהאצה של 1.5–1.73x, מתווה שעמיד מול בקרת היצוא האמריקאית.