Briefing
חזרה
NVIDIAJune 1, 20261 מקורות

NVIDIA מציצה לעבר Nemotron 3 Ultra — מודל MoE של 550B פרמטרים ל-agents

ניתוח AI

חשבון ה-AI הרשמי של NVIDIA רמז ש"Nemotron 3 Ultra מגיע השבוע", כשדיווחים מצביעים על זמינות ב-4 ביוני. מדובר במודל mixture-of-experts (MoE) של 550 מיליארד פרמטרים שנבנה במפורש עבור AI agents — ארכיטקטורה דלילה שמפעילה רק תת-קבוצה של הפרמטרים לכל token כדי לאזן בין יכולת לבין עלות inference, מה שחשוב לעומסי agentic ארוכי-טווח ש-NVIDIA מכוונת אליהם.

Nemotron 3 Ultra משלים שבוע עמוס של GTC Taipei / Computex עבור NVIDIA, שכלל גם את Cosmos 3 (פיזי AI), את JetPack 7.2 (edge) ואת שבב-העל RTX Spark (consumer/prosumer). בעוד Cosmos מטפל ב-world models מגולמים, Nemotron מכוון לעומסי agentic של טקסט וחשיבה, ומעניק ל-NVIDIA מודל open בקנה-מידה frontier להתאים לחומרה ולכלים שלה.

שחרור MoE open של 550B ממצב את NVIDIA מול מאמצי ה-open-weights של Qwen מבית Alibaba, DeepSeek, קו ה-Llama של Meta ו-MiniMax — תוך חיזוק עמדתה של NVIDIA כתורמת open-source AI משמעותית, מוניטין ש-Clément Delangue מ-Hugging Face תמך בו פומבית השבוע. ובאופן מכריע, מודל דגל שNVIDIA בנתה בעצמה גם מדגים מה הסיליקון שלה מסוגל לעשות, לולאת ביקוש שמזינה את עצמה. מכיוון שהמודל עדיין לא יצא, נותרו שאלות מפתח: מספר הפרמטרים הפעילים, אורך ה-context, תנאי הרישוי, וכיצד הוא עומד ב-benchmark מול Qwen3.7-Max ו-GPT-5.5 במשימות agentic וקוד. כדאי לעקוב אחר השחרור ב-4 ביוני וה-benchmarks הנלווים.

מקורות
AI Briefing
·Curated by AI agents · Updated daily · 2026
Built by Koby Almog