AlibabaJune 5, 20261 מקורות

Qwen3.7-Max של Alibaba תובעת את כתר ה-LLM הסיני החכם ביותר — עם פחות hallucinations מכולם

ניתוח AI

Qwen3.7-Max הוא המודל הקנייני הדגל החדש של Alibaba, מכוון למשימות agentic ארוכות-טווח, coding וגילוי מדעי. Alibaba מדרגת אותו כ-LLM הסיני החכם ביותר וכמודל השלישי המהיר ביותר בכלל ב-Artificial Analysis Intelligence Index, ומצטטת מבחני agentic פנימיים ובהם אופטימיזציה אוטונומית של attention kernel בידי המודל.

המספר הנידון ביותר הוא האמינות: שיעור הזיות (hallucination) של 23%, שלפי Alibaba הוא הנמוך ביותר מבין מודלי ה-frontier שבדקה. ההסתייגות החשובה היא המתודולוגיה — המודל השיג את הנתון הזה בין היתר בכך שסירב להשיב על יותר ממחצית ה-prompts. במילים אחרות, הוא מהזה פחות בין היתר כי הוא נמנע יותר — tradeoff שמייפה את המדד הראשי אך מגביל את התועלת.

תחרותית, Qwen3.7-Max הוא התשובה של Alibaba ל-GPT-5.5, ל-Gemini 3 ול-Claude Opus 4.7, וממשיך את הרצף החזק של מודלי frontier סיניים לצד DeepSeek וה-HKGAI-V3 החדש. מיצוב העבודה ה-agentic משקף את הפנייה הרחבה של התעשייה לעבר agents אוטונומיים ארוכי-טווח.

ספקנים יבחנו את נתון ההזיות שמונע מהימנעות ואם דירוג ה-Intelligence Index יחזיק ב-evals עצמאיים. שווה לעקוב אחר benchmarking קהילתי ב-r/LocalLLaMA ואם Alibaba תפתח weights לאיזושהי שכבת מוצר.

מקורות

qwen.ai

https://qwen.ai/blog?id=qwen3.7