NVIDIA2026-04-19
NVIDIA השיקה אופטימיזציות מלאות לאינפרנס agentic עם פלטפורמת Dynamo

ניתוח AI
NVIDIA פרסמה טכניקות אופטימיזציה ל-agentic AI inference, תוך הדגשת אימוץ בעולם האמיתי כאשר Stripe מייצרת 1,300+ PR-ים בשבוע באמצעות agent-ים ו-Ramp מייחסת 30% מה-PR-ים הממוזגים ל-agent-ים. פלטפורמת Dynamo מתמודדת עם לחץ KV cache בworkflow-ים של agent-ים עם 85-97% hit rate במטמון.