Hugging FaceMay 16, 20263 מקורות

שפע מודלים פתוחים: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 ו-GLM-5.1 נחתו בשבוע אחד

ניתוח AI

זהו השבוע הצפוף ביותר של שחרורי open-weights ברמת frontier מאז DeepSeek V3 בסוף 2024. DeepSeek-V4-Flash מקבל את עיקר תשומת הלב בזכות שינויים ארכיטקטוניים ל-long-context — inference זול יותר ב-contexts ארוכים הוא בדיוק היכולת ש-open-source חסר ביחס לחלון 2M של Gemini ול-1M של Claude. הקוונטיזציה Kimi-K2.6-NVFP4 של NVIDIA, המתארחת ב-Hugging Face, הופכת את הדגל של Moonshot לפריס על מחסניות inference של NVIDIA בדיוק FP4 — איתות אמינות ש-Nvidia רואה ב-open-weights סיניים יעד inference לגיטימי.

PaddleOCR 3.5 נחת על backend של Hugging Face Transformers באותו יום, ושילב OCR ופירוק מסמכים ב-pipeline הסטנדרטי של Transformers. ובמקביל, Inference Endpoints v2 של Hugging Face (scale-to-zero, ניתוב agent-aware, vLLM בקליק) השיקה כדי להפעיל את כל זה.

סיכום Interconnects ממסגר זאת בחדות: open weights בשפע ומשתפרים מהר, אבל פער היכולות המצרפי מול GPT-5.5 / Claude 4 / Gemini 2.5 נשאר. ההימור המעניין אינו אם open תדביק את ה-frontier — אלא האם open-weights 'מספיק טובים' בעשירית מהעלות יעצבו מחדש את ה-mid-market הארגוני מהר יותר ממה שמעבדות frontier מצליחות לרדת לשוק. Cursor Composer 2.5 (הבנוי על Kimi K2.5), שמשתווה ל-Opus 4.7 ול-GPT-5.5 ב-benchmarks בשבריר מהעלות, הוא ה-case study הקונקרטי השבוע.

מה לעקוב הלאה: איזה מודל ינחת ראשון על Bedrock כהצעה מנוהלת, והאם Meta תצליח עם Llama 4 (לפי שמועות בתזמון פוסט-פיטורים) לאפס את שיח ה-open-weights.

מקורות

interconnects.ai

https://www.interconnects.ai/p/latest-open-artifacts-21-open-model

whatllm.org

https://whatllm.org/blog/new-ai-models-may-2026

huggingface.co

https://huggingface.co/blog/PaddlePaddle/paddleocr-transformers