Qwen3.7-Max עולה למקום ה-4 ב-Code Arena — בגובה Claude Opus 4.6

צוות Qwen של Alibaba הכריז ב-27 במאי ש-Qwen3.7-Max עלה למקום הרביעי ב-Code Arena עם ציון זהה ל-Claude Opus 4.6, מה שהופך אותו למעבדה הסינית המדורגת ביותר בלוח. הצוות רמז שיש 'עוד מה לשלוח' בשבועות הקרובים.
המיקום בולט כי Code Arena הפך ללוח הדירוג הנצפה ביותר להעדפות מפתחים, ומעבדות סיניות היסטורית הופיעו שם בעמדות חלשות יחסית לביצועים שלהן בהערכות מסוג benchmark. הופעת בכורה במקום הרביעי — לפני מודלים ישנים יותר של Anthropic, מספר checkpoints של Google, ומתחרים שונים open-source — סוגרת את הפער באופן משמעותי, גם אם Opus 4.8 (שיצא יום אחרי) העלה שוב את הרף.
מסגרת תחרותית: באותו שבוע xAI טענה ש-Grok V9 סיים אימון עם מינון כבד של data מ-Cursor, Greg Brockman מ-OpenAI כינה את GPT-5.5 'טוב באופן ייחודי' לקוד, ו-Anthropic השיקה את Opus 4.8 עם 88.6% ב-SWE-bench. קוד הוא ה-benchmark השנוי במחלוקת של הרבעון, ו-Qwen נמצאת עכשיו במרוץ באופן מוחשי.
למעקב: האם Qwen3.7-Max יופיע כברירת מחדל בכלי המפתחים המערביים המיינסטרים (Cursor, Windsurf, Cline), וכיצד מהדורות Qwen הבאות שהצוות רמז עליהן ישתוו ל-Opus 4.8.