NVIDIAJune 12, 20262 מקורות

פי 20 מ-Hopper: ה-Blackwell Ultra GB300 של NVIDIA שובר את benchmark ה-AA-AgentPerf

ניתוח AI

ה-benchmark בשם AA-AgentPerf מודד עומסי inference ייחודיים ל-AI agents — רב-שלביים, עתירי קריאות לכלים, ועם reasoning בהקשר ארוך — וה-GB300 של NVIDIA לפי הדיווח סיפק שיפור פי 20 בתפוקה לעומת דור Hopper. NVIDIA צירפה לתוצאה טענה לביצועים מובילים ב-benchmark הראשון בתעשייה לכתיבת קוד אג'נטית, וממצבת את Blackwell Ultra כפלטפורמת הייחוס לעידן ה-agent בדיוק כש-Rubin מתקרב.

NVIDIA גם פרסמה הנחיות deploy להרצת MiniMax M3 — reasoning בהקשר ארוך וזרימות עבודה אג'נטיות — על התשתית המואצת שלה, מה שמחזק אסטרטגיית software-plus-silicon שמטרתה להפוך את ה-GPUs שלה למצע ברירת המחדל לפריסות agent. המסגור סביב benchmark אג'נטי מתוזמן אסטרטגית: כש-Google, AWS ו-Azure כולן עוברות לפלטפורמות agent-first, NVIDIA רוצה שהחומרה שלה תמוצב כפותרת צווארי הבקבוק בעומסים עתירי-כלים וארוכי-טווח.

ספקנים מציינים ש-benchmarks שמורצים בידי הספק עצמו מטים לטובת מסלולי האופטימיזציה שלו, ושה-latency האמיתי של agents בעולם האמיתי תלוי במידה רבה ב-orchestration ובתקורת קריאות לכלים, לא רק בתפוקת GPU גולמית. ובכל זאת, קפיצה דורית אמינה של פי 20 הייתה משנה משמעותית את כלכלת השירות של agents. מה לעקוב אחריו: תוצאות AA-AgentPerf עצמאיות, לוח הזמנים והמפרט של השקת Rubin, וכיצד יגיב הסיליקון המותאם של המתחרים (TPUs, Trainium, Maia).

מקורות

developer.nvidia.com

https://developer.nvidia.com/blog/nvidia-achieves-leading-agentic-coding-performance-on-first-agentic-ai-benchmark/

wccftech.com

https://wccftech.com/nvidia-gb300-dominates-agentic-ai-workloads-20x-performance-leap-over-hopper/