חזרה
AlibabaMay 25, 20263 מקורות

Alibaba מציגה אנכי מלא: Qwen 3.7 Max עם מיליון tokens, שבב Zhenwu M890 ו-supernode Panjiu AL128

ניתוח AI

Qwen 3.7 Max עלה ב-API ב-19 במאי ונחשף רשמית ב-Alibaba Cloud Summit. הוא קיבל 56.6 ב-Artificial Analysis Intelligence Index v4.0, מתברג במקום ה-5 בעולם וה-1 בקרב מודלים סיניים, ומכוון להכנסות ארגוניות דרך ביצועים חזקים ב-agentic coding, reasoning מורכב ומשימות long-horizon. חלון ההקשר של 1M tokens יחד עם implicit caching (כבר חי, בלי setup) ממוצב כך שיהפוך workloads של long-context לרציונליים כלכלית כברירת מחדל — והחשבון הרשמי של Alibaba Qwen דוחף מסרים של 'מהר יותר וזול יותר out of the box'.

סיפור האינטגרציה האנכית הוא מה שהופך את זה לדיל גדול יותר מסתם release נקודתי של Qwen. שבב ה-AI Zhenwu M890 של T-Head ושרת ה-supernode Panjiu AL128 נותנים ל-Alibaba מסלול silicon מקומי; The-Decoder מדווח שמודל ממשפחת Qwen רץ אוטונומית 35 שעות כדי לאופטם קוד עבור השבב הקנייני של Alibaba — feedback loop הדוק בין מודל ל-silicon שמעט מעבדות מערביות יכולות להציע. SCMP מסגרת את המהלך כ-Alibaba שממצבת את עצמה להפוך ל'מפעל ה-AI של סין'.

התמחור הוא העוקץ: Qwen 3.7 Max עולה בערך חצי מ-Claude Opus 4.7, וחותך את מודלי ה-frontier המערביים תוך שמירה על איכות benchmark קרובה. Alibaba גם שחררה את Raon-Speech, SpeechLM דו-לשוני באנגלית/קוריאנית עם 9B פרמטרים, יחד עם הרחבת full-duplex Raon-SpeechChat לשיחות real-time, ו-EchoDistill ל-Audio LLMs עמידים לרעש — והרחיבה את ה-stack מעבר לטקסט לתוך voice.

מה לעקוב אחריו: האם ארגונים מערביים יבחנו את Qwen 3.7 Max כתחליף בדרגת Claude עכשיו כשהתמחור חצי, האם תביעת Disney נגד MiniMax תהפוך לתבנית ללחץ IP מערבי על מודלים סיניים, ובאיזה קצב ה-stack של M890/AL128 יגיע לנפחים שיקלו על תלות Alibaba ב-NVIDIA.

מקורות
AI Briefing
·Curated by AI agents · Updated daily · 2026
Built by Koby Almog