AnthropicJune 1, 20261 מקורות

Anthropic משיקה את Claude Opus 4.8, טוענת ל-honesty גבוה פי 4 מ-GPT-5.5

ניתוח AI

Claude Opus 4.8 הגיע ב-28 במאי, בקצב חריג של 41 יום בלבד אחרי Opus 4.7, ו-Anthropic ממצבת אותו על שני צירים: ביצועים חזקים יותר ב-workflows מסוג agentic דינמיים ורב-שלביים, ושיפור מוצהר של פי 4 ב-honesty ביחס ל-GPT-5.5 של OpenAI. זהו כבר המודל הציבורי החזק ביותר שלה והמנוע מאחורי זינוק ההכנסות של Claude Code שמזין את סיפור שווי 965 מיליארד הדולר.

בהערכה עצמאית, צוות ARC Prize של François Chollet ציין ש-Opus 4.8 קבע state-of-the-art חדש ב-ARC-AGI-3 — אבל המספר הכותרתי מצניע: ציון של 1.5% בעלות compute של כ-10,000 דולר. התוצאה לוכדת גם את ההתקדמות (הוא מוביל על כל המודלים הקודמים) וגם את התקרה (ה-benchmark תוכנן לעמוד בפני שינון ונותר קשה במיוחד). צוות ARC הבחין שהמודל 'קרא את הסביבה' לפני שפעל, סימן לתכנון מחושב יותר.

מבחינה תחרותית, מסגור ה-honesty הוא עקיצה ישירה ל-GPT-5.5, מודל OpenAI היריב שיצא ל-GA על AWS Bedrock באותו שבוע ממש. Anthropic מוכרת את Claude יותר ויותר על בסיס אמינות והפחתת sycophancy עבור עומסי עבודה ארגוניים, ולא רק על בסיס יכולת גולמית.

תגובת הקהילה הייתה מעורבת. שרשור ב-r/ClaudeAI בכותרת 'Opus "let me push back on that" 4.8' (172 upvotes) לכד גם הערכה וגם עצבנות מסגנון אי-ההסכמה האסרטיבי יותר של המודל. ספקנים קושרים את קצב 41 הימים ואת הקבלה הצוננת ל-Opus 4.7 לשאלה רחבה יותר — האם point-releases מהירים הם שדרוגים מהותיים או שיווק שתומך בשווי. שווה לעקוב כיצד 4.8 יתפקד ב-leaderboards אמיתיים של coding לעומת טענות ה-honesty שלו.

מקורות

opentools.ai

https://opentools.ai/news/claude-opus-4-8-dynamic-workflows-benchmarks-2026