Anthropic2026-05-10

METR בקושי מצליחה למדוד את Claude Mythos Preview; Palo Alto מזהירה משרשראות תקיפה אוטונומיות של 25 דקות

ניתוח AI

ב-METR מציינים שרק 5 מתוך 228 משימות ב-evaluation suite הנוכחי שלהם מכסות את טווח היכולות הרלוונטי של Claude Mythos Preview — פער מטריד בין eval ליכולת בפועל. בנפרד, Palo Alto Networks מדווחת שמודלי frontier מסוגלים לשרשר פגיעויות באופן אוטונומי ולהגיע ל-data exfiltration תוך 25 דקות בלבד.