NVIDIA מביאה את ה-AI הביתה: RTX Spark עם 128GB unified memory ומודלים של 120B לוקאלית על Windows

NVIDIA ניצלה את ה-keynote שלה בטאיפיי (Computex/GTC Taipei 2026, 1 ביוני) כדי לחשוף את RTX Spark, סופר-צ'יפ מבוסס Blackwell שמשלב עד 6,144 ליבות CUDA עם 128GB של unified memory ובערך petaflop אחד של עוצמת חישוב — מכוון ישירות למחשבי AI אישיים. הפיץ' של Jensen Huang: להריץ עומסי agentic AI — כולל מודל בגודל 120 מיליארד פרמטרים — מקומית על לפטופים ומחשבים שולחניים עם Windows, בלי סיבוב הלוך-ושוב לענן.
ה-128GB של unified memory הם הפתח הארכיטקטוני; זה מה שמאפשר למכונה צרכנית בודדת להחזיק מודל 120B בזיכרון, יכולת שעד עכשיו הייתה שמורה ל-datacenter או לתצורות Mac עילית. ניתוחים ב-Medium הציגו את זה כנקודת מפנה אמיתית לפיתוח על המכשיר, בעוד שספקנים ב-HN (257 נקודות, 449 תגובות) התווכחו אם מפרטי ה'חיה' מתורגמים ל-throughput בעולם האמיתי.
מבחינה תחרותית, RTX Spark הוא ירייה ישירה ליתרון ה-unified memory של סדרת M של Apple ולמהלך ה-AI PC של AMD, תוך מינוף הדומיננטיות התוכנתית של NVIDIA (CUDA, קואליציית Nemotron המתרחבת) כדי להביא עוצמת AI עילית לבסיס ה-Windows ההמוני. זה גם משתלב עם תמת ה-local-first ששלטה ב-r/LocalLLaMA השבוע — Gemma 4 QAT, מערכי GPU של homelab, toolkits ב-Rust בלי daemon. הסתייגויות: מחיר, חום וביצועים מתמשכים תחת עומסי agentic אמיתיים עוד לא הוכחו, ו'יכול להריץ מודל 120B' לא אומר כלום על tokens-per-second שמישים. מה לבדוק: benchmarks עצמאיים, זמינות לפטופים מ-OEM, והאם inference מקומי בסקייל הזה ינגוס בביקוש ל-inference בענן עבור עומסי prosumer.