NVIDIA2026-04-07

NVIDIA מקדמת AI אג׳נטי עם שיתוף פעולה Gemma 4, הדוגמנות בעלות NIM 2x, ודחיסת Neural Texture

ניתוח AI

NVIDIA ביצעה הודעות רבות השבוע: בשיתוף פעולה עם Google, היא הוציאה משפחת מודלים Gemma 4 אופטימלי לחומרה של NVIDIA ברחבי מכשירים מסמארטפונים לעד למערכות IoT, כולל מודל MoE הראשון של Gemma ל-agentic, on-device AI עם עיבוד נתונים מקומי בזמן אמת כדי להקטין latency ותלות בענן. NVIDIA NIM (Inference Microservices) הוא בעל throughput שיפורים 2x על GPUs H100 — benchmarked ב-1,201 tokens/second לעומת 613 ללא NIM על Llama 3.1 8B — תומכת ב-DeepSeek, Llama, Mistral, ו-SDXL על פני ענן, data center, וסביבות PC. בנוסף, NVIDIA הדגימה Neural Texture Compression (NTC) הורדת שימוש VRAM מ-6.5GB ל-970MB (הפחתה של ~85%), מיצוב דחיסה מונעת AI כמשלים ל-DLSS 5 שמתמקדות בעיתיות ולא בשחזור תמונה.