AnthropicMay 28, 20261 מקורות

Claude Opus 4.8 כאן: חשיבה אדפטיבית ומצב מהיר זול פי 3 — אבל בקהילה כבר צועקים 'nerf'

ניתוח AI

Anthropic השיקה את Claude Opus 4.8 כשדרוג ישיר ל-Opus 4.7, עם שיפור ביכולות הקוד, ה-workflows מסוג agent, ה-reasoning ועבודת הידע המקצועית — והכל בלי העלאת מחיר. התמחור נשאר על 5 דולר למיליון input tokens ו-25 דולר למיליון output tokens. הגרסה החדשה מוסיפה רמות מאמץ שהמשתמש שולט בהן (להגדרה דרך /effort ב-Claude Code וב-Cowork) ו-thinking אדפטיבי, שמאפשר למודל להתאים את כמות החישוב לקושי המשימה. fast mode מחודש זול עכשיו בערך פי שלושה ומהיר פי 2.5 מהדורות הקודמים, ומכוון לעומסים בנפח גבוה ורגישים ל-latency.

התגובות היו רועשות ומפולגות. ההשקה שלטה ב-Hacker News עם 1,744 נקודות ו-1,361 תגובות, והשרשור החגיגי ב-r/singularity הגיע ל-989 הצבעות חיוביות. אבל מצב הרוח התהפך מהר: שרשור בשם 'Opus 4.8 nerfed??' ב-r/Anthropic הגיע ל-862 הצבעות ו-144 תגובות, ופוסט נפרד בשם 'Does Anthropic realize Opus 4.7 is awful?' אסף 311 הצבעות — עדות לתסכול אמיתי סביב נסיגות מורגשות במשימות קטנות של one-shot. פרשנים כמו Dan Shipper טענו ש'אפשר היה לקרוא לזה Opus 5', ושיבחו refactors ארוכי-טווח על פני מספר קבצים וירידה מדווחת של פי 4 בפגמי קוד לא מדווחים.

מבחינה תחרותית, Opus 4.8 יושב על כ-80.8% ב-SWE-bench Verified מול 88.7% של GPT-5.5, אבל האימוץ הארגוני נוטה בבירור לטובת Anthropic (כ-47% מול כ-6% של xAI). המודל כבר מופץ בהיקף רחב — זמין לכל משתמשי Perplexity Max בתור orchestrator, ופעיל ב-AWS Kiro IDE, ב-CLI וב-Web, שם Swami Sivasubramanian מ-AWS הדגיש self-verification חזק יותר ל-workflows מבוססי spec וקריאות tool יעילות יותר. כדאי לעקוב אם תלונות ה'nerf' משקפות נסיגות אמיתיות או תקלות routing/quantization בפריסה.

מקורות

anthropic.com

https://www.anthropic.com/news/claude-opus-4-8