סין משיגה: Z.ai טוענת ש-GLM 5.2 משתווה ל-Mythos בסייבר בזמן שארה״ב עוצרת את המודלים המובילים

חברת ה-AI הסינית Z.ai (Zhipu) טוענת שהמודל GLM 5.2 שלה משתווה ל-Mythos של Anthropic במשימות cybersecurity, וחברת האבטחה 360 חשפה כלי גילוי פגיעויות שהיא ממצבת כמתחרים ל-Mythos. התזמון הוא הסיפור: הטענות צצו בדיוק כשממשלת ארה"ב הגבילה את Sol של OpenAI ואת Mythos של Anthropic, מה שמעלה את האפשרות הלא-נוחה שבקרות מסוג export על המודלים המובילים של ארה"ב מאטות את המגנים בלי למנוע כלים יכולתיים מהיריבים.
הטענות הטכניות נשארות לא מאומתות — 'משתווה ל-Mythos ב-benchmarks של cyber' היא קביעה שיווקית עד לבדיקה עצמאית — אבל הן קיבלו אמינות מפוסט בלוג של Semgrep שהופץ בהרחבה, 'GLM 5.2 מנצח את Claude ב-benchmarks של cyber שלנו', שהגיע ל-523 נקודות ב-Hacker News והזין דיון שהמודלים הפתוחים הסיניים סוגרים את הפער מול חברות ה-AI המובילות. העובדה ש-GLM 5.2 הוא מודל פתוח מקשה להפריך את טענת השוויון, יותר מטענה על מודל סגור.
הרקע התחרותי עז. DeepSeek, שמוערכת כעת ביותר מ-50 מיליארד דולר אחרי סבב גיוס ראשון של 7.4 מיליארד דולר, מתכננת להכפיל את כוח האדם שלה, ועבודת היעילות DSpark של DeepSeek מראה שחברות ה-AI הסיניות מתקדמות גם בעלות וגם ביכולת. יחד אלה מערערים את ההנחה שעיכוב המודלים האמריקאיים שומר על יתרון.
התגובה ב-r/singularity הייתה טעונה, כולל thread של 'סין הנבל-העל' (295 upvotes, 408 תגובות) שתפס את הפחד של פקידי ארה"ב מלהישאר מאחור 'אפילו במעט'. חוקרי אבטחה כמו Alex Stamos טענו שהמודלים המוגבלים לא מראים סיכונים מעבר למערכות ציבוריות אחרות, מה שמחדד את הספקנות לגבי הרציונל של ה-cybersecurity. שווה לעקוב האם benchmarks עצמאיים יאששו את טענות ה-cyber של GLM 5.2, והאם מקבלי ההחלטות בארה"ב יבחנו מחדש את היגיון ההגבלה ככל שמודלים סיניים פתוחים מתרבים.