Other2026-05-17

benchmark המתמטיקה SOOHAK: AI פותר בביטחון בעיות שאין להן פתרון

ניתוח AI

קונסורציום של 64 מתמטיקאים בנה את SOOHAK, benchmark של 439 משימות בכתב יד כולל 99 שאין להן פתרון בכוונה. Gemini 3 Pro מוביל בבעיות מחקר עם 30%, אבל אף מודל לא חוצה 50% בזיהוי משימות שבורות — יותר compute לא עוזר למודלים להודות שלבעיה אין תשובה.