GLM-5.2 מוביל את טבלת המודלים הפתוחים עם context של מיליון tokens בכשישית מהמחיר
GLM-5.2, הדגל החדש של Z.ai, תפס את המקום הראשון במדד אינטליגנציית המודלים הפתוחים של Artificial Analysis, ומעצים את הוויכוח האם המודלים הפתוחים סוגרים את הפער מול חברות ה-AI המובילות. מותאם למשימות ארוכות-טווח, GLM-5.2 מציע חלון הקשר יציב של מיליון token ויכולות coding מתקדמות עם 'effort levels' גמישים שמאפשרים למשתמשים להחליף בין ביצועים ל-latency.
הסיפור הטכני כולל שיפורים ארכיטקטוניים: 'IndexShare' מצמצם את ה-FLOPs לכל token, ושכבת MTP (multi-token prediction) משופרת משפרת speculative decoding, ומעלה את אורך הקבלה ב-עד 20% — רווחים שמכוונים ישירות ליעילות ו-throughput. זווית העלות היא הכותרת עבור מפתחים רבים: Forbes מדווח ש-GLM-5.2 מקבל 62.1 ב-SWE-bench Pro, מקדים בקצת את GPT-5.5, תוך שהוא רץ בערך בשישית מהעלות של המודלים הסגורים האמריקאיים המובילים.
תגובת הקהילה הייתה רועשת. GLM-5.2 בראש המדד משך 823 נקודות ו-399 תגובות ב-Hacker News, כשמפתחים מתווכחים האם המודלים הפתוחים באמת סגרו את הפער. מצב הרוח הרחב ב-r/LocalLLaMA שורי — 'Running local models is good now' של Vicki Boykis הגיע ל-1,521 נקודות — מה שמרמז שמודלים מקומיים ופתוחים חצו סף שמישות.
ההשלכות התחרותיות משמעותיות. כפי שניסח זאת המאמר של Eric Newcomer (ששותף על ידי Hugging Face): 'עלויות מזנקות מעוררות עניין מחודש ב-AI open-source. חברות סיניות הרבה לפנים.' GLM-5.2, לצד DeepSeek ו-Qwen, מזין את התזה שהמודלים הפתוחים הסיניים מונעי-היעילות מאיימים על הכלכלה עתירת-הדאטה-סנטרים של גישת המודלים הסגורים של ענקיות הטכנולוגיה — אותה חרדה שדוחפת את Microsoft לבחון את DeepSeek עבור Copilot. ההסתייגות: ציוני leaderboard לא תמיד מתורגמים לאמינות production, ומלכודות distillation אמיתיות (r/LocalLLaMA מזהיר ש-distillations של Qwen/Claude לעיתים גרועות מהמודלים הבסיסיים). שווה לעקוב אחר אימוץ ארגוני והאם חברות ה-AI האמריקאיות יגיבו על מחיר.