Other2026-04-11

GLM-5.1 של Z.AI השיג SOTA על SWE-Bench Pro עם ציון 58.4%, ניצח את GPT-5.4 ו-Claude Opus

ניתוח AI

סטארט-אפ AI סיני Z.AI שחרר את GLM-5.1, מודל open-source עם 754B parameters ורישוי MIT שקיבל ציון 58.4% ב-SWE-Bench Pro, עולה על GPT-5.4 (57.7%) ו-Claude Opus 4.6 (57.3%). המודל מציג עיצוב 'agentic engineering' לביצוע משימות אוטונומי של 8 שעות, ארכיטקטורת mixture-of-experts וחלון הקשר של 202,752 tokens עם מנגנון 'stepped optimization' חדשני להימנעות מ-performance plateaus. GLM-5.1 מייצג התקדמות משמעותית ביכולות קידוד open-source, מאתגר את דומיננטיות מודלים closed-source במשימות software engineering.