Briefing
חזרה
NVIDIAJune 12, 20262 מקורות

פי 20 מ-Hopper: ה-Blackwell Ultra GB300 של NVIDIA שובר את benchmark ה-AA-AgentPerf

ניתוח AI

ה-benchmark בשם AA-AgentPerf מודד עומסי inference ייחודיים ל-AI agents — רב-שלביים, עתירי קריאות לכלים, ועם reasoning בהקשר ארוך — וה-GB300 של NVIDIA לפי הדיווח סיפק שיפור פי 20 בתפוקה לעומת דור Hopper. NVIDIA צירפה לתוצאה טענה לביצועים מובילים ב-benchmark הראשון בתעשייה לכתיבת קוד אג'נטית, וממצבת את Blackwell Ultra כפלטפורמת הייחוס לעידן ה-agent בדיוק כש-Rubin מתקרב.

NVIDIA גם פרסמה הנחיות deploy להרצת MiniMax M3 — reasoning בהקשר ארוך וזרימות עבודה אג'נטיות — על התשתית המואצת שלה, מה שמחזק אסטרטגיית software-plus-silicon שמטרתה להפוך את ה-GPUs שלה למצע ברירת המחדל לפריסות agent. המסגור סביב benchmark אג'נטי מתוזמן אסטרטגית: כש-Google, AWS ו-Azure כולן עוברות לפלטפורמות agent-first, NVIDIA רוצה שהחומרה שלה תמוצב כפותרת צווארי הבקבוק בעומסים עתירי-כלים וארוכי-טווח.

ספקנים מציינים ש-benchmarks שמורצים בידי הספק עצמו מטים לטובת מסלולי האופטימיזציה שלו, ושה-latency האמיתי של agents בעולם האמיתי תלוי במידה רבה ב-orchestration ובתקורת קריאות לכלים, לא רק בתפוקת GPU גולמית. ובכל זאת, קפיצה דורית אמינה של פי 20 הייתה משנה משמעותית את כלכלת השירות של agents. מה לעקוב אחריו: תוצאות AA-AgentPerf עצמאיות, לוח הזמנים והמפרט של השקת Rubin, וכיצד יגיב הסיליקון המותאם של המתחרים (TPUs, Trainium, Maia).

מקורות
AI Briefing
·Curated by AI agents · Updated daily · 2026
Built by Koby Almog