AnthropicMay 21, 20264 מקורות

הכאב של production יוצא החוצה: retry cascades, 14% כשלי JSON ועלויות O(n²) חבויות ב-agents

ניתוח AI

זה השבוע שבו קהילת ה-agent engineering עברה מהייפ של דמואים למציאות של production, עם שלושה פוסטים ב-Dev.to (כולם של Mukunda Katta) שזיקקו את הכאב. ראשון: הידרדרות של 22 דקות ב-5xx של Anthropic, שבה מדיניות ה-retry של שירות agent הנפיקה מחדש קריאות כושלות במהירות שבה ה-API החזיר שגיאות, ויצרה מפולת backlog בהתאוששות. הפתרון — circuit breakers עם exponential backoff וכן בדיקת half-open לזיהוי התאוששות — נטען כיום כחובה לכל agent harness ב-production.

שני: לאורך 12,400 קריאות structured-output ל-Claude (רובן Sonnet 4.5/4.7), רק 86% נשפו כ-JSON בניסיון הראשון למרות prompts מפורשים ללא גדרות. Claude מחזיר ```json fences ב-14% מהמקרים, ו-Katta שחררה crate ב-Rust לחילוץ עמיד של JSON מתגובות כאלה. זה מספר אמינות קונקרטי שרוכשים enterprise יכולים להחזיק את Anthropic אחראית אליו — וסימן ש-prompt engineering לבד לא מספיק ל-structured outputs בקנה מידה.

שלישי: ריצת agent בת 3 שלבים שהמפתח ציפה שתעלה 12 סנט הסתיימה בחיוב של 4.20 דולר — נפיחות של פי 35 — בגלל דפוס קריאות-כלים בסיבוכיות O(n²) שהחיוב per-call של Anthropic לא חושף. הכלי החדש agenttrace מקבץ קריאות לפי ריצה כדי לחשוף נקודות חמות של מבנה עלות. זה משתלב במסגור 'remote worker' בפוסט ויראלי נוסף שטוען ש-Claude Code, Codex ו-agents מנוהלים זקוקים ל-sandboxes, ל-prompts אישור ול-handoff לנייד — ה-harness ב-open-source בשם MateClaw הוצג כאחת התשובות.

תחרותית, הפוסטים האלה ילחצו על Anthropic לחשוף טלמטריית עלות ברמת ריצה, לשפר אמינות structured-output ולשלוח דפוסי circuit-breaker רשמיים. ה-MCP tunnels החדשים וה-sandboxes הביתיים עוזרים בבידוד אך לא נוגעים ישירות בפערי האמינות ותצפיתיות-העלות. צפו שעדכוני Code with Claude הבאים יטפלו לפחות בבעיית ה-JSON-parse ובעלות ברמת ריצה — אלה כיום benchmarks ציבוריים שהקהילה תחזיק את Anthropic אחראית אליהם.

מקורות

dev.to

https://dev.to/mukundakatta/our-retry-loop-made-an-outage-worse-the-circuit-breaker-stopped-the-cascade-4n47

dev.to

https://dev.to/mukundakatta/claude-returned-json-blocks-14-of-the-time-here-is-the-rust-crate-i-wish-i-had-earlier-4dp6

dev.to

https://dev.to/mukundakatta/a-3-step-agent-cost-me-420-agenttrace-showed-me-the-on-tool-call-hiding-in-plain-sight-3omp

dev.to

https://dev.to/bu_feng_ccd4f1398071c5317/coding-agents-are-becoming-remote-workers-enterprises-need-an-agent-harness-3l79