Claude Opus 4.8 נוחת: מיליון tokens, Dynamic Workflows והוזלה של 67%
Claude Opus 4.8 הוא השחרור הטכני המרכזי של Anthropic, המתואר כ-'משתף פעולה אפקטיבי יותר' עם שיפורים משמעותיים ב-agentic coding, חשיבה רב-תחומית, computer use, עבודת ידע וניתוח פיננסי. המודל מוסיף context window של 1M tokens, fast mode שרץ פי 2.5 מהר יותר ובערך פי שלושה זול יותר, והוזלה במחיר ה-output tokens שדווחה על כ-67% — מה שמביא אותה לסביבות 5 דולר input / 25 דולר output למיליון tokens. Anthropic גם טוענת לשיפור של פי 4 ב-'כנות', כשהמודל מסמן אי-ודאות במקום להמציא תשובות.
הפיצ'ר הבולט הוא Dynamic Workflows ב-Claude Code, שמאפשר למודל לתאם subagents מקבילים על משימות גדולות יותר, לצד הגדרות חדשות של effort-control ב-Claude.ai וב-Cowork שמאפשרות למשתמשים להגביר או להנמיך חשיבה אדפטיבית. Boris Cherny, שמוביל את Claude Code, ועמיתיו הדגישו את שליטת ה-/effort כדרך להחליף latency בעומק. Swami Sivasubramanian מ-AWS ציין self-verification חזק יותר ש'מצוין ל-spec-driven workflows' כש-Opus 4.8 נחת ב-Kiro IDE.
מבחינה תחרותית, Opus 4.8 מתמודד מול GPT-5.5 ומול Gemini 3.5 Pro הצפוי של Google, כשההוזלה מכוונת בבירור ללחץ ה-intelligence-per-dollar של DeepSeek. אבל ההשקה הייתה מקטבת: שרשור 'Opus 4.8 nerfed??' ב-r/Anthropic (862 upvotes) ופוסט ב-r/OpenAI שטוען שהמודל 'מתרסק ב-SimpleBench' מראים נסיגות בעולם האמיתי שחלק מהמשתמשים מדווחים עליהן, למרות שיפורים ב-benchmarks.
ההסתייגות המרכזית מצד הבונים: 'price ≠ cost'. מגיבים ב-Hacker News הזהירו שהוזלות per-token בכותרות לא מרסנות חשבונות usage-based, וציטטו משתמשי Copilot שעלויותיהם זינקו לאלפי דולרים בחודש. ה-fast mode הזול יותר עשוי או לדמוקרטיזציה של עומסי עבודה agentic, או להאיץ את בעיית ההוצאה הבלתי-נשלטת שארגונים כעת מנסים לרסן באופן פעיל.