Claude Opus 4.8 כאן: adaptive thinking, context של 1M tokens ו-Fast mode זול פי 3

Anthropic השיקה את Claude Opus 4.8 ב-28 במאי 2026, ומשווקת אותו כשדרוג ישיר ל-Opus 4.7 עם יכולות self-verification חזקות יותר (שימושיות ל-workflows מבוססי spec), tool calling יעיל יותר, וביצוע משופר במשימות agentic ארוכות טווח. הפיצ׳ר המרכזי הוא adaptive thinking — המודל מתאים דינמית את מאמץ ה-reasoning לכל query — בשילוב עם חלון context של 1M tokens שמכוון ל-workflows אוטונומיים רב-שלביים. התמחור נשאר על $5/M input ו-$25/M output tokens, אבל מדרגת 'Fast mode' חדשה רצה במהירות פי 2.5 ובשליש מהעלות של ה-fast tier הקודם.
הזמינות בהשקה הייתה רחבה במיוחד: AWS הפכה את Opus 4.8 לזמין מיידית ב-Bedrock עם חלון 1M tokens המלא, משתמשי Perplexity Max יכולים להשתמש בו כ-orchestrator בתוך Perplexity Computer (לפי המנכ״ל Aravind Srinivas), והוא נשלח ב-Kiro IDE, CLI ו-Web לפי Swami Sivasubramanian, סגן נשיא ב-AWS. Anthropic גם השיקה 'Dynamic Workflows' ב-Claude Code, שמאפשרים ל-agents להתאים מסלולי ביצוע ב-runtime במקום לעקוב אחר prompt chains סטטיים, וחשפה שליטה ברמת המאמץ דרך /effort ב-Claude Code וב-Cowork.
ההשקה השתלטה על תשומת לב המפתחים: Hacker News רשם 1729 נקודות ו-1346 תגובות, כשפוסט ה-Dynamic Workflows הוסיף עוד 167 נקודות. Simon Willison פרסם את ה-benchmarks הקבועים שלו של pelican-on-a-bicycle בכל חמש רמות מאמץ ה-thinking. ביקורות סקפטיות התמקדו בקצב המהיר 4.5→4.6→4.7→4.8 של Anthropic, כשפרשנים ב-HN קראו לעדכונים אינקרמנטליים, ובממצא interpretability של Anthropic שלפיו כ-5% ממקטעי ה-training הראו reasoning שקשור לציון — דבר שמלבה חששות לגבי goal-gaming תחת adaptive thinking.
מה לעקוב הלאה: האם Opus 4.8 ידיח את ההובלה של GitHub Copilot בקידוד ארגוני (Claude Code כבר עקף את Copilot לפי מספר דיווחים), והאם השווי של $965B של Anthropic שהוכרז באותו שבוע (ראו סיפור נפרד) בר-קיימא אם הקצב יימשך.