AlibabaMay 28, 20261 מקורות

Qwen3.7-Max של Alibaba מטפס למקום 4 ב-Code Arena WebDev — מעל OpenAI ו-Google

ניתוח AI

Qwen3.7-Max של Alibaba טיפס למקום הרביעי גלובלית בלוח ה-WebDev של Code Arena ב-28 במאי, והכה מודלים פרוסים של OpenAI ו-Google ב-benchmarks של בניית web applications. שלושת המקומות הראשונים נשארים בידי מודלי Claude של Anthropic, מה שהופך את Alibaba למפתחת הלא-אמריקאית היחידה בחמישייה הראשונה — סמן בולט בנרטיב התחרות בין ארה"ב לסין על AI, במיוחד לאור הזמינות החינמית של המודל דרך Alibaba Cloud.

Alibaba ממצבת את Qwen3.7-Max כמודל agentic רב-תכליתי שמשתרע על coding, אוטומציית משרד וביצוע משימות אוטונומיות ארוכות-טווח. החברה הדגימה את המודל רץ באופן עצמאי לתקופות ממושכות על משימות מורכבות רב-שלביות — הרף שכל מעבדות החזית מתחרות עליו כעת. בנפרד, חשבון ה-X הרשמי @Alibaba_Qwen הכריז ש-Qwen3.5 הגיע לשיא של 580 tokens-per-second בעומסי agent על מנוע ה-inference TokenSpeed, וזיכה בשיתופי פעולה עם Lightseek, NVIDIA AI, צוות Mooncake וקבוצת Tri Dao.

ההקשר התחרותי: זו השקת המודל הסיני השלישי במחלקת החזית בתוך שבועיים, לצד DeepSeek V4-Pro (כעת עם הנחת קבע של 75%, ראו סיפור נפרד) ומהלכי המודלים הקטנים-יעילים של Moonshot ו-Liquid AI. דומיננטיות Claude Code של Anthropic בראש הטבלה נשארה בעינה, אבל הפער מתחת ל-Claude מאוכלס כעת על ידי מעבדות סיניות במקום OpenAI ו-Google. Code Arena הוא benchmark אמין (eval מבוסס-קהל בסגנון LMSys), אבל ספקנים מציינים ש-WebDev ספציפית מעדיף מודלים שכווננו לפלט מילולי רב-קבצים, מה שייתכן ולא יתכלל לקוד backend או systems.

מה לעקוב הלאה: האם Qwen3.7-Max יזכה לאימוץ אנטרפרייז אמריקאי בהינתן צל export-controls, והאם ההשקה הבאה של Qwen תסגור את הפער שנותר ל-Claude. הקריאה הקהילתית ב-Hacker News היא שה-ecosystem הסיני של open-weight הופך לאיום מבני על מעבדות החזית הסגורות בארה"ב על ציר ה-price-performance.

מקורות

scmp.com

https://www.scmp.com/tech/tech-trends/article/3354087/alibaba-teases-new-qwen-previews-highest-ranking-chinese-ai-models-arena