הראש-לשעבר של Qwen: ה-hybrid thinking נכשל — והעתיד הוא agents

Junyang Lin, מי שהיה ה-technical lead של צוות Qwen ב-Alibaba, הציע ניתוח כן בדיעבד על ההימורים בעיצוב של Qwen3 — במיוחד מצבי החשיבה ההיברידיים ותקציבי החשיבה הדינמיים, שניסו לאפשר למודל יחיד לעבור בין תשובות מהירות לחשיבה מעמיקה. מסקנתו: המיזוג לא עמד בציפיות, והכיוון המבטיח יותר הוא מעבר מ'reasoning thinking' ל'agentic thinking', נתמך בתשתית reinforcement-learning אגֶ'נטית קשה יותר.
הביקורת משמעותית מפני שהיא מגיעה ממקורב שבנה אחת ממשפחות המודלים הפתוחים המשפיעות ביותר. חשיבה היברידית הייתה רעיון שהועתק בהרחבה (תקציבי reasoning משתנים מופיעים בכל התעשייה), כך שמייסד שאומר שזה לא הסתדר כמקווה הוא אות משמעותי לגבי לאן עיצוב המודלים הולך.
המסגור של 'agentic thinking' פירושו לייעל מודלים כדי לפעול — לתכנן, להשתמש בכלים, לבצע משימות רב-שלביות בסביבות — ולא רק לחשוב לאורך זמן פנימי. זה דורש סביבות RL ותשתית שקשה יותר לבנות מ-benchmarks סטטיים של reasoning, וזה הטיעון המרכזי של Lin לגבי לאן צריך להפנות את המאמץ הבא.
הקשר תחרותי: זה מגבש את נושא-השבוע — הפנייה אל agents. זה מתיישר עם מסגרת הרובוטיקה ASPIRE של NVIDIA, דחיפת ה-deploy האגֶ'נטית של AWS, מוצרי ה-agent של xAI, ואפילו מחקר ה-multi-agent הזהיר של Apple. באופן בולט, זה ממותן בממצא של Apple שלפיו תיאום multi-agent נוכחי מתפקד מתחת לצפוי — מה שמרמז שתשתית העידן האגֶ'נטי עדיין לא בשלה. מה לעקוב: האם שחרור ה-Qwen הבא של Alibaba ישקף את הפילוסופיה האגֶ'נטית-תחילה הזו.