NVIDIA2026-04-16
Benchmarks של Blackwell Ultra GB300 מציגים שיפור throughput של 50% על פני H100

ניתוח AI
NVIDIA פרסמה מפרט תפוקת inference מפורט עבור Blackwell Ultra GB300, המדגים 50% יותר tokens לשנייה מ-H100 SXM על עומסי transformer סטנדרטיים. ה-GB300 כולל זיכרון HBM3e של 288GB לכל GPU, המאפשר הגשה של מודלים בכיתת 70B ללא tensor parallelism. זמינות בענן דרך AWS, Azure ו-Google Cloud צפויה ברבעון השלישי של 2026.