Other2026-04-16

מודל GLM-5.1 הסיני ראשון לנצח GPT-5.4, Opus 4.6 ו-Gemini 3.1 Pro באותו benchmark

ניתוח AI

GLM-5.1 של Z.ai הובילה את SWE-Bench Pro ב-0.7 נקודות על מודלי הדגל המערביים תוך הצגת ביצוע אוטונומי מתמשך הנמדד בשעות ולא ב-tokens. המודל מדגים יכולת פעולה רציפה של 8 שעות, פותר אתגרי deploy מעשיים שמודלים של turn בודד לא יכולים לטפל. זה מייצג את המודל הפתוח הראשון שמתעלה בו-זמנית על כל חברות AI המערביות הגדולות ב-benchmark סטנדרטי.