AlibabaJune 6, 20262 מקורות

Alibaba משיקה את Qwen3.7-Plus: agent מולטימודלי שקורא מסכים וכותב קוד

ניתוח AI

צוות Qwen של Alibaba שחררה ב-2 ביוני את Qwen3.7-Plus, מודל agent מולטימודלי שמשלב תפיסה ויזואלית, שליטה ב-GUI ויצירת קוד בתוך agent loop אוטונומי — וכעת זמין באופן כללי דרך פלטפורמת Bailian של Alibaba Cloud. המודל קולט טקסט, תמונות ווידאו ומפיק טקסט, מה שמאפשר לו לקרוא מסכים, לנווט באפליקציות, לייצר קוד מתוך תבניות ויזואליות ולהפעיל כלים חיצוניים ללא ליווי אנושי.

יכולת השליטה ב-GUI היא הבידול המרכזי: במקום סתם צ'אט, Qwen3.7-Plus יכול לתפוס ממשק ולפעול בו — הבסיס ל-computer-use agents שמבצעים אוטומציה ל-workflows אמיתיים. Alibaba שילבה את המודל עם מהלך אסטרטגי לפתוח את Qwen לשירותי צד-שלישי, במטרה מוצהרת לבנות רשת מסחר מונעת-AI ולדחוף ל'שליטה ב-agents', לפי סיקור של Caixin ו-StockTwits.

תחרותית, זו ריצה של Alibaba מול ה-computer-use של Anthropic, ה-agents בסגנון Operator של OpenAI וה-Gemini ה-agentic של Google — עם go-to-market בעל גוון מסחרי מובהק שממנף את האקוסיסטם הקמעונאי של Alibaba. זה גם משתלב בגל הרחב של מעבדות סיניות: אסטרטגיות open-weight ושאיפות agent אגרסיביות משנות את התחום.

הסתייגויות: agents שפועלים ב-GUI ידועים כשבירים באפליקציות אמיתיות, הפעלת כלים אוטונומית מעלה את אותן חששות של prompt-injection וסמכות שצוינו במקומות אחרים השבוע, וזמינות Bailian נוטה לפריסה בשוק הסיני. מה לעקוב אחריו: benchmarks של אמינות עבור קריאת מסכים ומשימות GUI, וכיצד פתיחת Qwen לצדדים שלישיים תתורגם לאחיזה מסחרית.

מקורות

marktechpost.com

https://www.marktechpost.com/2026/06/02/alibabas-qwen-team-launches-qwen3-7-plus-adding-vision-deep-reasoning-tool-invocation-and-autonomous-iteration-on-the-bailian-platform/

caixinglobal.com

https://www.caixinglobal.com/2026-06-04/alibaba-opens-qwen-ai-to-third-party-services-in-push-for-agent-dominance-102450730.html