AlibabaMay 30, 20262 מקורות

Qwen3.7-Max של Alibaba רביעי ב-Code Arena ועוקף מודלים פרוסים של OpenAI ו-Google

ניתוח AI

Qwen3.7-Max של Alibaba השיגה דירוג עליון בטבלת WebDev של Code Arena, מיקמה במקום הרביעי ועקפה מודלים פרוסים כיום של OpenAI ו-Google במשימות agentic של פיתוח web. התוצאה היא ניצחון benchmark בולט עבור מודל מ-ecosystem סיני פתוח בזירת הקוד שהפכה לשדה הקרב התחרותי המוביל בתעשייה.

Qwen3.7-Max הוא מודל בקנה-מידה גדול עם למעלה מטריליון פרמטרים וחלון context של מיליון tokens, שתוכנן עבור workflows מונעי-agent הפורשים על פני קוד, אוטומציה משרדית ומשימות מורכבות ארוכות-טווח. Alibaba חשפה אותו בכנס בינלאומי ב-26 במאי כחלק מהמהלך הרחב שלה — לצד שבבים בהתאמה אישית — להפוך ל"מפעל ה-AI של סין", על פי כיסוי של SCMP.

מיקום ה-benchmark חשוב תחרותית מכיוון שהוא מציב את Qwen ישירות מול אותה יכולת agentic של קוד ש-Opus 4.8 של Anthropic, Codex של OpenAI ו-Composer 2.5 של xAI מתחרים עליה, והוא עושה זאת מהצד הסיני של ה-ecosystem לצד הדחיפה מונעת-המחיר של DeepSeek. ביצועי agent חזקים בפיתוח web הם בדיוק העומס שארגונים פורסים תחילה. כמו תמיד עם טענות טבלת מובילים, ההסתייגות היא ספציפיות ה-benchmark: מקום רביעי ב-WebDev מרשים אך צר, ואמינות בעולם האמיתי על פני codebases מגוונים היא המבחן הקשה יותר. כדאי לעקוב כיצד טביעת הרגל של טריליון הפרמטרים מתורגמת לעלות serving ול-latency.

מקורות

varindia.com

https://www.varindia.com/news/alibaba-unveils-qwen-3-7-max-as-agentic-ai-race-intensifies

scmp.com

https://www.scmp.com/tech/big-tech/article/3354212/alibaba-unveils-new-qwen-model-custom-chips-bid-become-chinas-ai-factory