AnthropicJune 13, 20261 מקורות

Anthropic מתנצלת: שלחה מנגנוני בטיחות סודיים ב-Fable 5 — והמפתחים מרדו

ניתוח AI

עוד לפני שההשעיה הממשלתית השתלטה על הכותרות, Claude Fable 5 כבר היה שנוי במחלוקת בקרב מפתחים. פוסט ב-r/MachineLearning בשם 'Anthropic's new model Fable will silently handicap work on LLMs' (366 upvotes) טען שהמודל מדרדר בשקט משימות הקשורות ל-AI/ML באמצעות guardrails לא מוצהרים. אחרי הסערה, Anthropic התנצלה בפומבי וחזרה בה ממדיניות ה-nerfing השקטה, והתחייבה ליידע משתמשים כאשר ההתנהגות מוגבלת — היפוך שכוסה בפתיל המשך ב-r/MachineLearning (248 upvotes).

האירוע גיבש מתח חוזר: חברות AI שמטמיעות אילוצי התנהגות בלתי-נראים שצפים רק כשמפתחים נתקלים בכשלים בלתי-מוסברים. מפתחים טענו ש-nerfing לא מוצהר שוחק אמון והופך מודלים לבלתי-אמינים לעבודת הנדסה רצינית, שבה שחזוריות חשובה.

במקביל, Anthropic הכריזה על מלגת Claude Corps בהיקף 150 מיליון דולר שתשבץ 1,000 עמיתים בעמותות כדי ללמד אימוץ AI אפקטיבי — מהלך פילנתרופי שמבקרים תיארו כמשקל-נגד של מחווה טובה לפגיעות המוניטין של אותו שבוע.

ההתנצלות על ה-guardrails נקראת כעת כפרומו לאובדן אמון גדול בהרבה, לאור הכיבוי הגלובלי הפתאומי של המודל ימים ספורים אחר כך. כדאי לעקוב האם Anthropic תפרסם מדיניות שקיפות לגבי אילוצי מודל והאם תוכנית Claude Corps תתקדם בעיצומה של מערבולת בקרת הייצוא.

מקורות

opentools.ai

https://opentools.ai/news/anthropic-claude-fable-5-secret-guardrails-apology-backlash-2026