יום ראשון, 21 ביוני 2026עדכון אחרון

יום א׳, 21 ביוני 2026חי

ספק

חדשות ה-AI של NVIDIA

כל כתבות ה-AI שפרסמנו על NVIDIA — 101 כתבות לאורך 4 אפר׳ 2026 – 21 יוני 2026. עקבו אחר השקות המודלים, המחקר, המוצרים והשותפויות של NVIDIA בתעשיית ה-AI, בעדכון יומי.

101 כתבות · 4 אפר׳ 2026 – 21 יוני 2026

NVIDIA ו-SK Telecom יבנו ענן AI קוריאני בקנה מידה גיגה-ואט על DSX

NVIDIA ו-SK Telecom הכריזו על תוכניות ל-AI Cloud בסדר גודל של gigawatt בקוריאה תוך שימוש בפלטפורמת NVIDIA DSX, כש-AI factory ראשון יושק ב-2027. ב-GTC Taipei, Jensen Huang גם חשף את פלטפורמת המחשוב Vera Rubin ואת ה-CPU בשם Vera.

2026-06-21

IREN חותמת על עסקת ענן של 3.4 מיליארד דולר עם NVIDIA כשהכנסות ה-AI מזנקות ב-839%

Nvidia אחראית לכמעט 90% ממכירות מאיצי ה-AI, וכורה הקריפטו לשעבר IREN Limited המחישה את הביקוש: הכנסות ה-AI שלה זינקו ב-839% שנה-על-שנה ל-33.6 מיליון דולר ברבעון השלישי של 2026 (23% מהסך הכל), על רקע חוזה cloud-services לחמש שנים בשווי 3.4 מיליארד דולר עם NVIDIA ו-5GW של הספק מובטח.

2026-06-21

NVIDIA ו-SK Telecom בונות AI Cloud קוריאני בסדר גודל גיגה-וואט על DSX

NVIDIA ו-SK Telecom הכריזו על תוכניות להקמת AI Cloud בסדר גודל של ג'יגה-וואט בקוריאה על בסיס פלטפורמת NVIDIA DSX, כשמפעל ה-AI הראשון יושק ב-2027. ב-GTC טאיפיי חשף ג'נסן הואנג גם את פלטפורמת המחשוב Vera Rubin ואת המעבד Vera CPU.

2026-06-20

NVIDIA מגייסת 25 מיליארד דולר באג״ח כדי לממן את ריצת ה-AI

Nvidia גייסה 25 מיליארד דולר באג"ח בדירוג גבוה למטרות תאגידיות כלליות על רקע בניית תשתית ה-AI שלה, אחרי ש-S&P שדרגה אותה ל-AA. החברה מחזיקה בכמעט 90% ממכירות מאיצי ה-AI, בזמן ש-Amazon נערכת לתחרות עם שבבים מותאמים.

2026-06-20

framework ה-XR AI של NVIDIA נכנס ל-beta ציבורי ל-agents במשקפי AR

NVIDIA הכריזה ש-NVIDIA XR AI נמצא כעת ב-public beta, ומספק למפתחים framework לבניית agents מולטימודליים ל-AR glasses ולמכשירי XR. החברה גם קבעה את האסיפה השנתית של בעלי המניות ל-2026 ב-24 ביוני, שתתקיים וירטואלית online.

2026-06-18

NVIDIA XR AI ב-beta ציבורי — agents נכנסים למשקפי AR

NVIDIA שחררה את XR AI ב-beta ציבורי — framework לבניית agents מולטימודליים עבור משקפי AR והתקני XR. הוא מתמודד עם פער התשתית שמפתחים נתקלים בו כשהם יוצרים חוויות AI לחומרה לבישה שכבר מוכנה אך חסרה כלי אינטגרציה.

2026-06-17

NVIDIA Blackwell GB300 קופצת פי 20 ב-agentic AI מול Hopper — ו-Rubin בדרך

Blackwell Ultra GB300 של NVIDIA רשם ביצועי שיא ב-AA-AgentPerf, benchmark חדש לזרימות עבודה של agentic-AI, ורץ פי 20 מהר יותר מ-Hopper כשדור Rubin מתקרב. NVIDIA ו-SK hynix חשפו שותפות רב-שנתית לזיכרון AI מהדור הבא, בעוד מחיר ה-RTX PRO 6000 Blackwell בנפח 96GB טיפס ביותר מ-50% ל-13,250 דולר על רקע מחסור בזיכרון.

2026-06-16

פי 20 מ-Hopper: ה-Blackwell Ultra GB300 של NVIDIA שובר את benchmark ה-AA-AgentPerf

NVIDIA דיווחה ש-Blackwell Ultra GB300 שלה קבעה שיאים ב-benchmark החדש AA-AgentPerf, והריצה עומסי AI אג'נטיים בערך פי 20 מהר יותר מ-Hopper, כשארכיטקטורת הדור הבא Rubin מתקרבת להשקה. NVIDIA דיווחה גם על ביצועים מובילים ב-benchmark הראשון בתעשייה ל-AI coding אג'נטי.

2026-06-15

NVIDIA משחררת את DiffusionGemma 26B ב-Hugging Face עם 1,100 tokens לשנייה על H100

NVIDIA שחררה ב-Hugging Face את DiffusionGemma 26B A4B IT NVFP4 — מודל generative מולטימודלי בגרסה quantized שפותח על ידי Google DeepMind על ארכיטקטורת Mixture-of-Experts של Gemma 4 26B A4B — שמציע יצירת טקסט בקצב של מעל 1,100 tokens בשנייה על GPUs מסוג Hopper H100, עם חלון context של 256K tokens.

2026-06-15

NVIDIA ו-Abridge בונות foundation model ייעודי לבריאות על Blackwell

NVIDIA ו-Abridge משתפות פעולה על foundation model ייעודי לתחום הבריאות, שבנוי על תשתית Blackwell ועל משפחת המודלים הפתוחים Nemotron, ומפעיל את פלטפורמת ה-clinician intelligence של Abridge — עם הטמעה רחבה בכל Northwestern Medicine.

2026-06-15

Nvidia ו-Abridge בונות מודל יסוד לבריאות — Northwestern Medicine ראשונה בתור

Nvidia משתפת פעולה עם Abridge, יצרנית אפליקציה לתיעוד קליני בזמן אמת, כדי לאמן מודל בסיס ייעודי לתחום הבריאות על משפחת Nemotron הפתוחה של Nvidia ועל תשתית Blackwell. המודל מטמיע reasoning קליני באופן מובנה במודל הבסיס ומושק במקביל לפריסה רוחבית בכל Northwestern Medicine.

2026-06-14

Blackwell Ultra NVL72 של NVIDIA מוביל את AgentPerf — ה-benchmark הראשון ל-agentic AI

Artificial Analysis השיקה את AgentPerf, ה-benchmark הראשון לתשתית AI אג'נטית, ופלטפורמת Blackwell Ultra NVL72 של NVIDIA סיפקה את התוצאות המובילות — הרצה של פי 20 agents ליחידת מגה-ואט וביצועי agentic coding בראש הטבלה — ציון יעילות מרכזי ל-workloads אג'נטיים.

2026-06-14

Nvidia רוכשת את Kumo AI ומשתפת פעולה עם Abridge על מודל לתחום הבריאות

Nvidia רכשה את Kumo AI כדי להביא AI חיזוי לנתונים עסקיים, בהמשך לדפוס רכישות שכולל את Run:ai (כ-700 מיליון דולר), Illumex והסכם עם Groq. היא גם מפתחת מודל AI לתחום הבריאות יחד עם הסטארטאפ Abridge המתמחה בהאזנת ambient, והשיקה blueprint לניהול AI factory לייצור אוטונומי.

2026-06-12

NVIDIA משחררת את Cosmos 3 — omni-model פתוח ל-AI פיזי ב-GTC 2026

NVIDIA השיקה את Cosmos 3, שמוצג כ-omni-model הפתוח הראשון ל-reasoning ופעולה של physical AI על פני וידאו, רובוטיקה ויישומים תעשייתיים. Jensen Huang הציג אותו ב-GTC 2026 לצד Adobe, Cohere, Google DeepMind, Meta, Microsoft, OpenAI ו-Tesla, והוא מתארח על Hugging Face.

2026-06-11

NVIDIA סוגרת זיכרון עם SK hynix ו-sovereign-AI עם NAVER — בזמן ש-D-Matrix נושפת בעורף

NVIDIA הכריזה על שותפות רב-שנתית עם SK hynix לפיתוח משותף של זיכרון מהדור הבא למפעלי AI, וכן על עסקה מורחבת עם NAVER לבניית תשתית AI ריבונית על פלטפורמת NVIDIA DSX. במקביל, הסטארטאפ D-Matrix הנתמך על ידי Microsoft מגביר ייצור שבבים כדי לאתגר את NVIDIA בתחום ה-inference, אם כי Jensen Huang טוען שהחברה שלו מובילה ב-inference בעלות נמוכה.

2026-06-10

מימון רובוטיקה מתפוצץ: Standard Bots בשווי מיליארד דולר, Nebius ו-NVIDIA פותחות מעבדת Physical AI

Standard Bots הגיעה לשווי של מיליארד דולר לאחר סבב Series C של 200 מיליון דולר, מה שמסמן עניין חזק של משקיעים ב-physical AI וברובוטיקה. Nebius ו-NVIDIA השיקו Physical AI Living Lab לסטארטאפים אירופיים של רובוטיקה, כאשר המחזור הראשון יתחיל בספטמבר 2026 וההגשות מתבצעות דרך צינור NVIDIA Inception.

2026-06-10

NVIDIA Confidential Computing מזין את Private Cloud Compute של Apple — ומתרחב ל-Google Cloud

GPUs של NVIDIA עם Confidential Computing משמשים כעת ל-confidential inference ב-Private Cloud Compute של Apple, כשהיא מתרחבת מעבר למרכזי הנתונים שלה אל Google Cloud. ה-GPUs, שנחשפו ב-WWDC, תומכים ב-inference בצד השרת עבור Apple Foundation Models שנבנו עם Apple ו-Google.

2026-06-10

Nvidia מהמרת על מחשבי AI ומרחיבה תשתית AI ריבונית עם NAVER

Nvidia מהמרת על ביקוש שעדיין לא הוכח ל-AI PCs, כשמחשבים ניידים מבוססי Nvidia עם Windows עשויים להתחרות במחשבי Mac על רוחב פס זיכרון — צוואר בקבוק מרכזי ב-AI. בנפרד, NAVER הקוריאנית מרחיבה את תשתית ה-sovereign AI שלה הבנויה על פלטפורמת Nvidia DSX, כדי לשרת תעשיות קוריאניות ולקוחות גלובליים עם מפעלי AI בקנה מידה תפעולי.

2026-06-09

128GB זיכרון מאוחד על השולחן: NVIDIA מביאה את RTX Spark Superchip למחשבים

NVIDIA חשפה את ה-RTX Spark Superchip, שמשלב GPUs מסוג Blackwell (עד 6,144 ליבות CUDA) עם עד 128GB זיכרון מאוחד כדי להריץ agentic AI מקומית על מחשבים ניידים ושולחניים עם Windows, בלי תלות בענן. ג'נסן הואנג פירט את הפלטפורמה ב-GTC Taipei/COMPUTEX, ו-NVIDIA השיקה אותה בדרום קוריאה עם KRAFTON, NC ואלופי ה-esports של T1 ברחבי ה-PC Bangs.

2026-06-08

NVIDIA מביאה את ה-AI הביתה: RTX Spark עם 128GB unified memory ומודלים של 120B לוקאלית על Windows

ב-Computex/GTC Taipei 2026, NVIDIA חשפה את RTX Spark — superchip מבוסס Blackwell עם עד 6,144 ליבות CUDA ו-128GB זיכרון מאוחד, שיכול להריץ מקומית מודל בן 120 מיליארד פרמטרים עם כ-petaflop אחד של עוצמת חישוב. הוא מביא AI agentic ללפטופים ולדסקטופים של Windows מהשורה, בלי תלות בענן, ומאתגר ישירות את Apple ו-AMD.

2026-06-07

NVIDIA משחררת את Nemotron-3-Ultra 550B מסוג LatentMoE עם context של מיליון

NVIDIA שחררה את Nemotron-3-Ultra-550B-A55B-Base-BF16 — מודל Latent Mixture-of-Experts היברידי עם 55B פרמטרים פעילים ו-550B בסך הכל, שכבות Multi-Token Prediction, pre-training על 20T tokens ותמיכה ב-context של עד מיליון tokens. הוא הושק ב-Perplexity למשתמשי Pro ו-Max, והוסיף חברים חדשים לקואליציית Nemotron.

2026-06-07

NVIDIA משיקה את Nemotron 3 Ultra: MoE open בגודל 550B ל-agents שרצים לאורך זמן

NVIDIA השיקה את Nemotron 3 Ultra, מודל open מסוג Mixture-of-Experts עם 550 מיליארד פרמטרים וארכיטקטורת Mamba-Attention היברידית, שבנוי ל-agents ש-AI שרצים לאורך זמן. NVIDIA מדווחת על throughput של inference גבוה עד פי 6 לעומת LLMs open דומים בדיוק דומה, חלון context של מיליון token, וציון ה-non-hallucination הגבוה ביותר בקבוצת ההשוואה שלה (78.7 ב-AA-Omniscience).

2026-06-06

NVIDIA משיקה את Cosmos 3 — ה-omni-model הראשון שהוא open לחלוטין ל-physical AI

NVIDIA השיקה ב-GTC טאיפיי את Cosmos 3, שמוצג כ-omni-model הפתוח לחלוטין הראשון בעולם ל-physical AI, הבנוי על ארכיטקטורת mixture-of-transformers שמשלבת vision reasoning, יצירת עולמות וניבוי פעולות. הוא שוחרר בגרסאות Nano‏ (16B) ו-Super‏ (64B) ב-Hugging Face ומקצר מחזורי אימון של physical AI מחודשים לימים. בנוסף הקימה NVIDIA את Cosmos Coalition יחד עם מעבדות רובוטיקה כמו Skild AI, Runway ו-Black Forest Labs.

2026-06-04

NVIDIA חושפת שבב AI ל-PC ביתי ו-DLSS 4.5 Ray Reconstruction ב-GTC טאיפיי

לצד Cosmos 3, NVIDIA הכריזה על שבב AI חדש שמכוון למחשבים אישיים — סימן לכניסה עמוקה יותר לשוק מכשירי הצריכה — ושחררה את DLSS 4.5 Ray Reconstruction עם transformer מהדור השני, שנתמך כבר ביותר מ-1,000 משחקים ואפליקציות RTX. ה-RTX Spark נקשר לחזון ה-'unmetered intelligence' של Microsoft ל-Windows.

2026-06-04

NVIDIA חושפת את ה-superchip RTX Spark ואת ה-CPU בשם Vera ב-Computex

Jensen Huang הכריז על ה-superchip בשם RTX Spark — שמשלב GPU מסוג Blackwell RTX (6,144 ליבות CUDA, petaflop אחד) עם CPU מותאם של Grace בעל 20 ליבות שנבנה דרך MediaTek מעל NVLink ו-128GB זיכרון מאוחד — לצד ה-CPU Vera ל-agentic AI ב-data centers, שצפוי ברבעון השלישי של 2026. Satya Nadella קשר את RTX Spark לאספקת 'unmetered intelligence' על Windows.

2026-06-03

NVIDIA חושפת את Nemotron 3 Ultra — מודל פתוח של 550 מיליארד פרמטרים ל-agents

NVIDIA השיקה את Nemotron 3 Ultra, מודל open mixture-of-experts של 550 מיליארד פרמטרים שנבנה ל-agents אוטונומיים ארוכי-טווח בקוד, מחקר ו-workflows ארגוניים, עם טענות ל-inference מהיר עד פי 5 ועלויות הרצה נמוכות ב-30%. ה-weights צפויים ב-Hugging Face, ModelScope ו-OpenRouter סביב ה-4 ביוני.

2026-06-03

NVIDIA מביאה agentic AI ל-edge עם JetPack 7.2 על Jetson

ב-Computex הכריזה NVIDIA על JetPack 7.2 עם יכולות AI אג'נטיות, תמיכה ב-NemoClaw, CUDA 13 על Jetson Orin, תמיכת Yocto, שיפור ביצועים ב-Jetson AGX Orin 32GB ותמיכת Multi-Instance GPU (MIG) ב-Jetson Thor — ודוחפת agents אוטונומיים לתוך deployments בקצה (edge) בעולם הפיזי עם inference חסכוני בזיכרון.

2026-06-02

NVIDIA מציצה לעבר Nemotron 3 Ultra — מודל MoE של 550B פרמטרים ל-agents

NVIDIA הודיעה ש-Nemotron 3 Ultra, מודל mixture-of-experts בן 550 מיליארד פרמטרים שנבנה ל-AI agents, 'מגיע השבוע' וצפוי להיות זמין ב-4 ביוני. המודל מרחיב את אסטרטגיית המודלים הפתוחים של NVIDIA מעבר ל-physical AI אל עבר reasoning אג'נטי בקנה מידה גדול.

2026-06-02

81.6 מיליארד דולר ברבעון: NVIDIA שוברת שיא לפני COMPUTEX

NVIDIA דיווחה על הכנסות שיא של 81.6 מיליארד דולר ברבעון הראשון של שנת הכספים 2027, עלייה של 85% משנה לשנה, כשהכנסות ה-data-center הגיעו ל-75.2 מיליארד דולר. המניה נסגרה על 211.14 דולר ב-29 במאי כשמשקיעים מתמצבים לקראת נאום ה-COMPUTEX 2026 של Jensen Huang בטאיפיי, על רקע ביקוש חזק ל-AI inference.

2026-06-01

אחרי עסקת ה-20 מיליארד של Nvidia: סטארטאפ השבבים Groq מגייס 650 מיליון

בעקבות ה-not-acqui-hire המדווח של Nvidia בהיקף 20 מיליארד דולר, סטארטאפ שבבי ה-inference‏ Groq מגייס לפי הדיווחים 650 מיליון דולר ממשקיעים קיימים כדי לבנות את עסקי ה-inference cloud שלו, בהובלת ה-CEO/CFO הזמני Adam Winter.

2026-06-01

NVIDIA מזהה נקודת מפנה בביקוש ל-inference — ומתחייבת ל-100-150 מיליארד דולר בטייוואן

NVIDIA דיווחה על נקודת מפנה משמעותית בביקוש ל-AI inference, מונעת מ-agentic AI בקנה מידה גדול. ה-CEO ג'נסן הואנג התחייב להוצאה שנתית של 100-150 מיליארד דולר בטייוואן עבור ייצור ושרשרת אספקה. החברה אישרה אספקה של ה-CPU Vera Rubin לחברות AI מובילות, עם זמינות לשותפים במחצית השנייה של 2026.

2026-05-31

NVIDIA מעלה את DeepSeek-V4-Pro-NVFP4 הקוונטיזי ל-Hugging Face

NVIDIA פרסמה את DeepSeek-V4-Pro-NVFP4 ב-Hugging Face — גרסה מכווצת ב-NVFP4 של מודל ה-Mixture-of-Experts בשם DeepSeek-V4-Pro, עם 1.6 טריליון פרמטרים בסך הכל (49 מיליארד פעילים). המודל עבר אופטימיזציה דרך Model Optimizer לשימוש מסחרי ולא-מסחרי, ומכוון ל-reasoning מתקדם, agentic AI, שימוש בכלים ומשימות מתמטיקה ותוכנה מורכבות.

2026-05-31

81.6 מיליארד דולר ל-NVIDIA, דאטה סנטר מזנק 92% — וג׳נסן מאיים על AMD ו-Intel ב-200 מיליארד

Nvidia היכתה את התחזיות עם EPS של 1.87 דולר על הכנסות של 81.6 מיליארד דולר (מול 78.9 מיליארד צפויים), כשהכנסות ה-data center צמחו ב-92% YoY וה-CEO Jensen Huang תיאר את הביקוש כ'פרבולי'. ההנהלה רמזה על כניסה אגרסיבית לשוק ה-server CPUs שעלולה לסחוט מ-AMD ו-Intel סביב 200 מיליארד דולר, והחברה העלתה את הדיבידנד הרבעוני מסנט אחד ל-25 סנט. דרייברי GeForce 610.47 WHQL החדשים גם מפסיקים תמיכה ב-Control Panel הישן.

2026-05-27

81.6 מיליארד דולר ברבעון: NVIDIA שוברת שיאים — ו-Jensen יוצא פומבית נגד Super Micro על הברחות שבבים

NVIDIA דיווחה על הכנסות רבעוניות של 81.6 מיליארד דולר, צמיחה של 85% שנה-על-שנה, כש-Jensen Huang מכנה זאת 'הרחבת התשתית הגדולה ביותר' בהיסטוריה. Huang הפעיל לחץ פומבי על Super Micro להדק בקרות סיכון לאחר שטייוואן עצרה שלושה אנשים בפרשת הברחת שרתי AI. Lenovo אישרה שהיא בונה לפטופים בשם N1x, ו-NVIDIA הצטרפה לקונסורציום ה-watermarking של SynthID מבית Google.

2026-05-26

רבעון שיא ל-NVIDIA: 81.6 מיליארד דולר, מעבדי Vera וארונות Vera Rubin ב-7.8 מיליון דולר

NVIDIA דיווחה על הכנסות של 81.6 מיליארד דולר ברבעון הראשון של 2026, בעיקר ממכירות ל-data centers של AI, והסירה בשקט את קטגוריית Gaming מהדוחות הכספיים. אנליסטים מצפים שב-Computex Taipei יוצגו מעבדי Vera שמכים את Intel ו-AMD ב-x86 פי 1.5 ב-inference של agents, כשב-Morgan Stanley מתמחרים rack בודד של Vera Rubin ב-7.8 מיליון דולר — מתוכם מעל 2 מיליון רק על זיכרון.

2026-05-25

OpenBMB משחררת את VoxCPM2: חלופת open-source ל-ElevenLabs עם תמיכה ב-30 שפות

OpenBMB שחררה את VoxCPM2, מודל דיבור של 2B פרמטרים שתומך ב-voice cloning, voice design וסינתזה איכותית ב-30 שפות בלי תיוג שפה מפורש. השחרור ממוצב כחלופה open-source חינמית ל-ElevenLabs ורץ ביעילות על GPUs צרכניים של NVIDIA.

2026-05-25

NVIDIA שוברת שיא: 58.3 מיליארד דולר רווח, ו-Anthropic מצטרפת כ-hyperscaler חדש

NVIDIA דיווחה על EPS מתואם של 1.62 דולר על הכנסות של 68.12 מיליארד דולר (עלייה של 73% YoY), רווח שיא של 58.3 מיליארד דולר, buyback של 80 מיליארד דולר והעלאת דיבידנד ל-0.25 דולר למניה. Jensen Huang אמר ש-NVIDIA זכתה לאחרונה ב-Anthropic לצד OpenAI, xAI, Meta MSL ו-Microsoft, וחזה מכירות של טריליון דולר ב-Grace Blackwell וב-Vera Rubin.

2026-05-24

NVIDIA שוברת שיא: 79% צמיחה ברבעון, רווח מתואם של 42.97 מיליארד דולר — ו-Anthropic נכנסת רשמית כלקוח hyperscale

NVIDIA דיווחה על צמיחה של כ-79% בהכנסות ורווח מתואם שעלה ב-81.8% ל-42.97 מיליארד דולר ברבעון אפריל, כש-Jensen Huang סיפר ל-CNBC שהחברה מגדילה נתח שוק בקרב hyperscalers של frontier models, ומנה את Anthropic לצד OpenAI, xAI, Meta MSL ו-Microsoft. למרות התוצאות החזקות, המניה לא הרשימה — המשקיעים כבר מסתכלים קדימה לעבר עומסי inference ולסבב הצ'יפים הבא ב-data centers.

2026-05-23

Hark מגייסת מעל 700 מיליון דולר בשווי 6 מיליארד למכשירי "personalized intelligence"

Hark Inc. הכריזה על גיוס Series A של יותר מ-700 מיליון דולר בהובלת Parkway Venture Capital, בהשתתפות NVIDIA, Intel Capital, AMD Ventures, Qualcomm Ventures ו-Salesforce Ventures. הסטארטאפ בונה חומרת 'personalized intelligence' לצרכנים, בשווי של 6 מיליארד דולר — עסקה נדירה שבה NVIDIA, Intel, AMD ו-Qualcomm יושבות באותו cap table.

2026-05-23

NVIDIA קופצת ב-79% — ו-AMD זורקת mini-PC של 4,000 דולר ישר מול DGX Spark

Nvidia דיווחה על קפיצה של כ-79% בהכנסות שנה-על-שנה וצמיחה של 81.8% ברווח המתואם ל-42.97 מיליארד דולר, מעל תחזיות Wall Street, כשאנליסטים מסיטים את המיקוד מ-capex של training לביקוש ל-inference ולדברי Jensen Huang על סין. AMD החזירה מהלומה עם מיני-PC בשם Ryzen AI Halo במחיר 4,000 דולר ועם 128GB זיכרון on-board — מתומחר במכוון מול DGX Spark של Nvidia ב-4,000 דולר. במקביל, Nvidia הכריזה על עסקת BioNeMo עם Qiagen לגילוי תרופות.

2026-05-21

NVIDIA-Verified Agent Skills מביאים governance של יכולות ל-AI agents

NVIDIA הציגה את Verified Agent Skills, מסגרת governance ליכולות agent ניידות שעובדות עם כלים מחוברי MCP ועם מודלים open-source. התוכנית נועדה להפוך agents אוטונומיים לבטוחים ובעלי interoperability גבוהה יותר בין deployments, לצד פריסת ה-AI Factory של Dell ומבחן הדוחות של NVIDIA כשליטה בעידן ה-inference.

2026-05-20

NVIDIA צופה 95% צמיחה בהכנסות — רבעון רביעי ברציפות של האצה

NVIDIA דיווחה על צמיחה שנתית של 85% בהכנסות ברבעון אפריל — 12 נקודות מעל ינואר — וצופה צמיחה של 95% ברבעון הנוכחי. זה הרבעון הרביעי ברציפות שבו הצמיחה מאיצה במקום להאט, ומערער את התזה ש-'capex של AI מגיע לשיא' שרודפת את המניה מאז ההתחייבות של Anthropic ל-TPU בהיקף 200 מיליארד דולר.

2026-05-20

NVIDIA משקיעה בסטארטאפ Decart לניידות שבבים בשווי של כ-4 מיליארד דולר

Decart גייסה 300 מיליון דולר לפי שווי של כ-4 מיליארד דולר, כאשר Radical Ventures מובילה והמשתתפות כוללות את Nvidia, Adobe Ventures, Toyota Ventures ו-Andrej Karpathy. Decart בונה תוכנת אופטימיזציה ל-AI לצד מחקר world models, ובאופן בולט מקלה על מעבר בין שבבי AI — הימור חריג מצד Nvidia בהתחשב ביתרון ה-lock-in שלה.

2026-05-19

מניית NVIDIA נופלת 9% אחרי ש-Anthropic מתחייבת ל-200 מיליארד דולר ב-TPUs של Google ו-Trainium של Amazon חוצה 225 מיליארד בהתחייבויות

מניית NVIDIA צנחה ב-9% בשישה ימי מסחר על רקע תחרות מתגברת בסיליקון מותאם. Anthropic התחייבה לכ-200 מיליארד דולר ל-TPUs של Google על פני חמש שנים, ל-Trainium של Amazon יש התחייבויות הכנסה של מעל 225 מיליארד דולר (1.4M שבבים פרוסים בשלושה דורות, מתוכם 500K ב-Project Rainier בלבד), ו-Meta פורסת סיליקון תוצרת בית. NVIDIA עלתה רק 5% מתחילת השנה לעומת 55% של מדד מוליכי-למחצה של פילדלפיה. דוחות Q1 ב-20 במאי. בנפרד, סין עדיין חוסמת ייבוא H200 למרות הביקור של Trump ו-Jensen Huang בבייג'ינג.

2026-05-18

NVIDIA משחררת את SANA-WM, world model open-source של 2.6B: וידאו 720p של 60 שניות עם שליטת מצלמה ב-6-DoF על RTX 5090 בודד

NVIDIA הציגה את SANA-WM, מודל עולם open-source בגודל 2.6B פרמטרים עם שליטת מצלמה, שמייצר קליפים של 60 שניות ב-720p עם שליטת 6-DoF מדויקת על המצלמה. אומן על 64 כרטיסי H100 ורץ ב-inference על RTX 5090 בודד — מה שמוריד דרמטית את הרף לוידאו גנרטיבי איכותי ולמודלי עולם open-source.

2026-05-18

NVIDIA מתכננת מיני data centers צמוד לתחנות כוח לקראת דוחות 20 במאי

Nvidia חשפה תוכניות לפרוס mini data centers צמודים לתחנות כוח מקומיות כדי להתמודד עם צווארי הבקבוק של אנרגיה ב-AI. ברבעון הרביעי של FY26 ההכנסות הגיעו ל-68.13 מיליארד דולר, מתוכם 62.31 מיליארד מ-Data Center, עם 75% gross margin non-GAAP; התחזית לרבעון הראשון של FY27 עומדת על כ-78 מיליארד דולר. Trump אישר ש-China עדיין לא אישרה ייבוא של שבבי AI מ-Nvidia.

2026-05-17

BofA מעלה את יעד NVIDIA ל-320 דולר ומגדילה את TAM של דאטה-סנטרי AI ל-1.7 טריליון דולר עד 2030

Vivek Arya מ-Bank of America העלה את מחיר היעד של NVIDIA ל-320 דולר והעלה את ה-TAM של מערכות AI data center ל-1.7 טריליון דולר עד 2030, מתוכם 1.2 טריליון ב-AI accelerators. הניתוח יוצא כשמניית NVIDIA קופצת 4.5% ל-236 דולר (שווי שוק 5.71 טריליון) לקראת דוח Q1 FY27 ב-20 במאי, כש-Polymarket מתמחר 97% הסתברות להכאת התחזית. Trump אמר בנפרד ש-China לא אישרה ייבוא H200.

2026-05-17

NVIDIA חושפת פרטים על Vera Rubin scale-up ל-agentic AI; מתכננת מיני דאטה סנטרים בתחנות חשמל

NVIDIA פרסמה צלילה טכנית עמוקה לאופן שבו Vera Rubin מתמודדת עם ה-runtime הלא-דטרמיניסטי וארוך-המסלול של agentic inference, וחשפה תוכניות להקים מיני data centers צמודים לתחנות כוח מקומיות כדי לעקוף את צוואר הבקבוק של אנרגיה ל-AI. במקביל, framework בשם Hermes מאפשר עכשיו agents שמשתפרים בעצמם על מחשבי RTX ו-DGX Spark.

2026-05-15

PyTorch 2.12 משיק עם זירוז של עד פי 100 ל-linalg.eigh ב-batch על CUDA

PyTorch 2.12 מביא שיפורי מהירות משמעותיים ב-linear algebra על CUDA, כולל eigendecomposition בבאצ'ים מהיר פי 100 לפי הדיווח. release notes כוללים גם שיפורי kernel נוספים ועדכוני compiler.

2026-05-14

DeepSeek V4 Pro עולה ל-build.nvidia.com של NVIDIA — חלון של 1M, מעל 150 tok/s על GB200

DeepSeek V4 Pro — 1.6T פרמטרים עם 49B מופעלים וחלון context של מיליון tokens — מתארח כעת ב-build.nvidia.com של NVIDIA. benchmarks ראשונים על GB200 NVL72 (Blackwell Ultra) מדווחים על throughput של מעל 150 tokens בשנייה למשתמש, לצד הוזלה של 75% במחיר ה-API של V4 Pro ותמחור cache של עשירית מהמחיר — מהלך שכבר מאלץ מתחרים לכייל מחדש.

2026-05-14

NVIDIA מפעילה את Hermes — agents משפרי-עצמם — על RTX, ומתמודדת עם תביעת BIPA

NVIDIA הציגה את Hermes, agent מקומי שמשתפר בעצמו ורץ על RTX PCs ועל DGX Spark עם Qwen 3.6 27B שמשיג דיוק ברמת מודלים של 400B בגודל אחד חלקי 16. הקרן של Jensen רכשה compute ב-CoreWeave בשווי 108 מיליון דולר עבור אקדמאים. NVIDIA גם מתמודדת עם תביעת BIPA באילינוי בגין אימון voice.

2026-05-14

Recursive Superintelligence גייסה 650 מיליון דולר לפי שווי של 4.65 מיליארד ל-AI שמשפר את עצמו

GV ו-Greycroft הובילו סבב של 650 מיליון דולר ב-Recursive Superintelligence בהשתתפות Nvidia ו-AMD Ventures, לפי שווי של 4.65 מיליארד דולר. החברה ממקדת את המחקר שלה בארכיטקטורות מודל לשיפור עצמי — recursive self-improvement כיעד מחקרי מוצהר.

2026-05-14

ארה״ב אישרה מכירת Nvidia H200 לכ-10 חברות סיניות כולל Alibaba, Tencent ו-ByteDance

משרד המסחר האמריקאי אישר מכירה של שבבי Nvidia H200 לכ-10 חברות סיניות — בהן Alibaba, Tencent, ByteDance ו-JD.com — והקל על הגבלות הייצוא של AI לקראת ביקור הממלכתי של Trump בבייג'ינג.

2026-05-14

Cerebras תמחרה את ההנפקה ב-$185, ושווי המתחרה של Nvidia מזנק ל-$56B

Cerebras Systems תמחרה את ה-IPO שלה ב-185 דולר למניה — הרבה מעל הטווח המשווק של 115-125 דולר — ומכרה 30 מיליון מניות בשווי משתמע של 56 מיליארד דולר בדילול מלא. משקיעים כמו Foundation Capital, Benchmark ו-OpenAI רושמים רווחים גדולים על הימור של עשור נגד ה-GPU של Nvidia.

2026-05-14

NVIDIA בשיא של כל הזמנים לקראת Vera Rubin; נתבעת תחת BIPA באילינוי

NVDA נסגרה בשיא — הכנסות הרבעון הראשון צפויות לעמוד על $78.6B (+78% YoY). הפלטפורמה הקרובה Vera Rubin, לפי הדיווחים, מאמנת מודלים עם 75% פחות GPUs מ-Blackwell וחותכת את עלות ה-inference token ב-90%. בנפרד, עיתונאים ו-podcasters תבעו את NVIDIA תחת חוק ה-BIPA של אילינוי על שימוש בנתוני קול לאימון AI.

2026-05-13

Vera Rubin מתקרבת לשילוח עם טענות ל-75% פחות GPUs ל-training ו-90% inference זול יותר

פלטפורמת הדור הבא של NVIDIA, Vera Rubin — שמשלבת GPUs מסוג Rubin, CPUs מסוג Vera ו-NVLink 6 — מתחילה לפי הדיווחים להישלח לקראת קטליזטור ב-20 במאי. ההנהלה טוענת על הפחתה של 75% במספר ה-GPUs ל-training ו-90% פחות בעלות token ב-inference מול Blackwell. NVIDIA גם חשפה את Fleet Intelligence לניראות בזמן אמת על מערכי GPU גדולים.

2026-05-12

Nvidia מתחייבת ליותר מ-40 מיליארד דולר בעסקאות equity ב-AI ב-2026; Vera Rubin מתקרבת לשילוח

Nvidia התחייבה כבר ליותר מ-40 מיליארד דולר בעסקאות AI equity ב-2026 לבדה, וביססה את מעמדה כתומכת הפיננסית הגדולה בתעשייה. פלטפורמת הדור הבא שלה, Vera Rubin — שמשלבת Rubin GPU, Vera CPU ו-NVLink 6 — מאמנת לפי הדיווחים מודלים עם 75% פחות GPUs מ-Blackwell וחותכת את עלויות ה-inference tokens ב-90%. Wired טוענת ש-CUDA מוכיחה ש-Nvidia היא במהותה חברת תוכנה.

2026-05-11

NVIDIA ו-IREN חתמו על עסקת ענן של 3.4 מיליארד דולר לחמש שנים עם אופציית equity של 2.1 מיליארד ל-5 GW של תשתית AI

NVIDIA ו-IREN הכריזו על שותפות אסטרטגית לפריסה של עד 5 GW של תשתית AI, עם חוזה cloud services לחמש שנים בשווי 3.4 מיליארד דולר ואופציה ל-NVIDIA לרכוש מניות IREN בעד 2.1 מיליארד דולר במחיר 70 דולר למניה. מניית NVIDIA הגיעה לשיא בעקבות ההודעה. Blackwell Ultra בשלבי ramp-up, Rubin יושק ב-2026, ו-Feynman מתוכנן ל-2028.

2026-05-10

NVIDIA השיקה את cuda-oxide — backend קומפיילר מ-Rust ל-PTX

NVlabs פרסמה את cuda-oxide v0.1.0, codegen backend מותאם ל-rustc שמהדר פונקציות Rust מסומנות ב-`#[kernel]` ל-PTX דרך Stable MIR → Pliron IR → LLVM IR. בנייה משולבת host+device ממקור יחיד רצה מפקודה אחת של `cargo oxide build`. זה המהלך הרציני ביותר עד היום של NVIDIA להכניס את Rust ל-CUDA toolchain.

2026-05-10

NVIDIA Star Elastic אורז מודלי reasoning של 30B/23B/12B ב-checkpoint אחד

Star Elastic, שנבנה על framework של Nemotron Elastic ויושם על Nemotron Nano v3, מאמן שלוש וריאציות reasoning מקוננות בריצה אחת של 160B tokens, ומבטל את הצורך באימון ובאחסון נפרדים לכל גודל. חיתוך zero-shot מחלץ מודלים של 23B ו-12B מהמודל-אב של 30B בלי אימון מחדש.

2026-05-10

NVIDIA ו-Corning בשותפות ייצור תשתיות AI בארה״ב

NVIDIA ו-Corning חשפו שותפות ארוכת טווח להגדלת ייצור מקומי בארה"ב של רכיבי AI infrastructure, כולל optical connectivity ל-data centers. בנפרד, דוח של F5 מראה שארגונים מכניסים יותר ויותר AI inference פנימה אל ה-stacks של NVIDIA.

2026-05-09

Dynamo מוסיף streaming tokens ו-harness agentic מרובה תורות

NVIDIA Dynamo קיבל תמיכה ב-multi-turn agentic exchanges שמשלבים reasoning עם tool calls ומזרימים tokens דרך turns מובנים, במיקוד ל-serving agentic תוך שמירה על מצב האינטראקציה. חוקרים הראו בנפרד ש-decoding מוגבל-grammar משפר בחדות יצירת פקודות Bash ב-LMs קטנים.

2026-05-09

Huawei 950PR ממלא את החלל של NVIDIA בזמן ש-DeepSeek V4 מאופטם ל-inference על סיליקון סיני מקומי

Chosun מדווח שמודל V4 החדש של DeepSeek, אף שאומן על שבבי NVIDIA, מותאם במפורש להריץ inference על מאיץ 950PR של Huawei — מהלך שמאיץ את עצמאות ה-AI הסינית על רקע מגבלות הייצוא האמריקאיות. בנפרד, גישת ה-compute החדשה של Anthropic ל-Colossus של xAI ממחישה איך מחסור ב-compute משנה את מפת הלקוחות של NVIDIA.

2026-05-08

Jensen מסמן נקודת מפנה בביקוש ל-inference לקראת דוחות May 20; Rubin ב-2026

Jensen Huang הצביע על נקודת מפנה בביקוש ל-inference כמנוע הצמיחה הבא של NVIDIA, עם דוחות ב-20 במאי ו-keynote של GTC בטאיפיי ב-1 ביוני. ה-roadmap: Blackwell Ultra ב-ramp, Rubin ב-2026, Rubin Ultra ב-2027 ו-Feynman ב-2028. גם Mistral Medium 3.5 עלה השבוע ל-NVIDIA NIM.

2026-05-07

פלטפורמת Vera Rubin נכנסת ל-production ומכוונת לעלות inference נמוכה פי 10

פלטפורמת Rubin של NVIDIA — שישה chips חדשים — נכנסה לייצור עם הצהרות על עלות token של inference נמוכה פי 10 ופי 4 פחות GPUs לאימון MoE לעומת Blackwell. Spectrum-X Photonics מבטיח יעילות חשמלית טובה פי 5. AWS, Google Cloud, Microsoft ו-CoreWeave ישלחו מוצרי Rubin במחצית השנייה של 2026; Microsoft פורסת NVL72 ב-Fairwater superfactories שלה.

2026-05-07

NVIDIA מרחיבה את Spectrum-X Ethernet עם Multi-Rail Connectivity ל-AI בסקאלת ג׳יגה

NVIDIA הכריזה על Multi-Rail Connectivity (MRC) ל-Spectrum-X — ה-fabric האתרנטי הפתוח שלה ל-AI בסקייל גדול — וממצבת את הפלטפורמה כסטנדרט עבור AI factories ב-hyperscale. ההכרזה נחתמה במשותף עם AMD, Broadcom, Intel, Microsoft ו-OpenAI כפרוטוקול networking פתוח חדש שנועד לצמצם זמן GPU מבוזבז במהלך אימונים גדולים.

2026-05-06

NVIDIA חושפת את Nemotron Omni — מודל יסוד מולטימודלי ל-agents

NVIDIA שחררה את Nemotron Omni — מודל יסוד מולטי-מודלי חדש במשפחת Nemotron, שמתוכנן לשמש כ'מוח' עבור AI agents. הסיקור מתאר אותו כשדרוג מהותי שמכוון ל-workloads אגנטיים ומולטי-מודליים, והוא משתלב עם הרחבת השותפות של NVIDIA עם ServiceNow סביב Project Arc.

2026-05-06

NVIDIA ו-ServiceNow בשיתוף פעולה על סוכני AI אוטונומיים לארגונים

NVIDIA ו-ServiceNow הכריזו על שותפות לאספקת AI agents אוטונומיים שנבנו ייעודית לסביבות enterprise, עם דגש על מעבר מ-reasoning לפעולה. במקביל ServiceNow הרחיבה את AI Control Tower כ-hub הממשל לכל ה-agentic workflows בארגון.

2026-05-06

Blitzy מגייסת 200 מיליון דולר בשווי 1.4 מיליארד לפלטפורמת coding-agents מקבילית

סטארטאפ פיתוח התוכנה האוטונומי Blitzy גייס 200 מיליון דולר לפי שווי של 1.4 מיליארד דולר כדי להרחיב פלטפורמת enterprise שמריצה אלפי coding agents במקביל. המייסד-שותף Sid Pardeshi הוא master inventor לשעבר ב-NVIDIA, והסיבוב מדגיש את התיאבון הלוהט של משקיעים לכלי פיתוח agentic.

2026-05-06

NVIDIA קבעה דוחות ל-May 20 ונאום פתיחה ב-GTC ל-June 1 לחשיפת ה-roadmap של Rubin ו-Feynman

ההרצאה של Jensen Huang ב-GTC ב-1 ביוני מטאיפיי תפרט את עליית הקצב של Blackwell Ultra, את Rubin שמושק ב-2026, את Groq 3 LPX במחצית השנייה של 2026 ואת Feynman ב-2028. NVIDIA גם מרחיבה את מערך מודלי ה-open שלה ל-AI אגנטי, פיזי ובריאות, ומדברת על נקודת מפנה משמעותית בביקוש ל-inference וצמיחה ב-sovereign AI, enterprise AI ו-physical AI.

2026-05-05

הכנסות ה-data-center של Nvidia מגיעות ל-193.7 מיליארד דולר כשה-hyperscalers מוציאים 710 מיליארד על AI

Nvidia דיווחה על זינוק של 75% בהכנסות ה-data-center ל-193.7 מיליארד דולר על רקע הביקוש ל-Hopper ו-Blackwell, כש-CUDA lock-in שומר על עלויות מעבר גבוהות אצל ה-hyperscalers. במקביל, Roche פרסה 3,500 GPUs מסוג Blackwell במפעל AI היברידי לגילוי תרופות.

2026-05-04

NeMo RL מוסיף speculative decoding לזירוז rollout פי 1.8 ב-8B

NVIDIA Research שילבה speculative decoding ישירות ב-NeMo RL עם backend של vLLM, ומספקת האצה של 1.8x ללא הפסדים בגודל 8B פרמטרים, עם תחזית להאצה end-to-end של 2.5x במודלים בקנה מידה של 235B.

2026-05-03

Nemotron 3 Nano Omni מאחד vision/audio/video/text ב-MoE של 30B

NVIDIA השיקה את Nemotron 3 Nano Omni — מודל multimodal hybrid MoE עם 30B פרמטרים (A3B אקטיביים) שלטענתה משיג throughput גבוה פי 9 ממודלים open omnimodal אחרים. ה-open weights זמינים ב-Hugging Face וכ-NIM microservice, וזמינות day-zero ב-Amazon SageMaker JumpStart.

2026-05-01

Microsoft Shader Model 6.10 מביא neural rendering לכל ה-GPUs

Microsoft חשפה preview של Shader Model 6.10 שמכניס neural rendering לתוך graphics APIs מיינסטרים, ומאפשר למפתחים לנצל matrix hardware על כל GPU במקום מסלולים בלעדיים ל-NVIDIA.

2026-05-01

Nemotron 3 Nano Omni: מודל multimodal פתוח של 30B עם 3B פעילים ל-edge agents

NVIDIA השיקה את Nemotron 3 Nano Omni — מודל multimodal open-weight שמאחד vision, audio ושפה בארכיטקטורה אחת, עם 30B פרמטרים אך רק 3B פעילים לכל inference. NVIDIA טוענת ל-throughput גבוה פי 9 ממודלים open דומים, הובלה בשישה benchmarks, ורישוי לשימוש מסחרי תחת NVIDIA Open Model Agreement.

2026-04-29

Foxconn מאיצה ייצור מדפי Groq 3 LPX ל-inference של מודלים בטריליון פרמטרים

Foxconn הפכה לספקית מובילה של ארון ה-inference מסוג Groq 3 LPX של NVIDIA, ומאיצה את אספקת זינוק ה-inference פי 35 ש-NVIDIA מבטיחה. ה-LPX מכוון למודלים בגודל טריליון פרמטרים על פלטפורמת Vera Rubin, עם racks ב-scale מלא שנשלחים מוקדם מהצפוי.

2026-04-29

NVIDIA חוצה 5 טריליון דולר כש-ETF המוליכים למחצה מזנק ב-40% באפריל

NVIDIA חצתה ב-24 באפריל שווי שוק של 5 טריליון דולר אחרי עלייה של 19% באפריל, כש-ETF המוליכים למחצה עלה 40.4% בחודש. הכנסות Q4 צמחו 73% YoY, הכנסות Data Center הגיעו לשיא של 62.3 מיליארד דולר (עלייה של 75%), ו-ramp של Blackwell Ultra בעיצומו כש-Rubin עדיין מתוכנן לסוף 2026.

2026-04-28

LLM-as-a-Verifier של Stanford/Berkeley/NVIDIA מנצח את GPT-5.5 ב-Terminal-Bench

Stanford, Berkeley ו-NVIDIA שחררו במשותף את LLM-as-a-Verifier, framework לאימות agents שמתחבר לכל agent harness או מודל. הגדלת compute הייעודי לאימות מאפשרת ל-framework לעקוף את GPT-5.5 ואת Claude Mythos ב-Terminal-Bench וב-SWE-Bench Verified. בין מחברי המאמר Ion Stoica (Databricks), Azalia Mirhoseini (לשעבר Anthropic) ו-Marco Pavone (NVIDIA).

2026-04-27

NVIDIA חושפת את Vera Rubin: שישה שבבים חדשים ו-inference זול פי 10 לעומת Blackwell

NVIDIA הכריזה על פלטפורמת Vera Rubin — מערכת AI בקנה מידה של rack הכוללת שישה שבבים חדשים, שנועדה להוזיל את עלות ה-inference token ב-10x לעומת פלטפורמת Blackwell. AWS, Google Cloud, Microsoft Azure ו-Oracle Cloud Infrastructure יהיו בין ספקי הענן הראשונים שיציעו instances של Vera Rubin. NVIDIA הכריזה גם על שותפות רב-שנתית עם Meta לאספקת מיליוני GPU מסוג Blackwell ו-Rubin — הן לסביבות on-premises והן לענן.

2026-04-25

NVIDIA חשפה Blackwell Ultra GPU והרחיבה קטלוג NIM microservices

NVIDIA פירטה את ה-GPU Blackwell Ultra B300, המציע עד פי 1.5 שיפור ברוחב פס זיכרון על פני ה-B200, מיועד ל-inference ואימון מודלים גדולים בקנה מידה. החברה הרחיבה את קטלוג ה-NIM microservices שלה לעל 150 endpoints מודלים מיטביים, כולל תמיכה במודלי Llama 4 ו-Mistral, עם שותפויות מורחבות עם Microsoft Azure ו-AWS.

2026-04-23

NVIDIA שחררה Nemotron 3 Super: מודל open של 120B ל-agentic workloads

NVIDIA השיקה את Nemotron 3 Super, מודל MoE היברידי פתוח של 120 מיליארד פרמטרים המיועד לצמצום עלויות חישוב להפעלת AI agents בקנה מידה. המודל מפעיל רק 12.7 מיליארד פרמטרים לכל inference תוך שמירה על יכולות דומות למודלים גדולים בהרבה, מיטוב ספציפי לאפליקציות agentic AI הדורשות חשיבה מתמשכת ושימוש בכלים.

2026-04-23

NVIDIA מדווחת על הכנסות שיא של 215.9 מיליארד דולר; פלטפורמת Rubin מבטיחה הפחתת 10X בעלויות inference

NVIDIA דיווחה על הכנסות שיא לשנת הכספים 2026 של 215.9 מיליארד דולר, עלייה של 65% משנה לשנה, כאשר הכנסות מרכזי הנתונים הגיעו ל-193.7 מיליארד דולר בזכות פריסות GPU מאסיביות. החברה הכריזה על פלטפורמת Rubin הכוללת שישה שבבים חדשים שמספקים עד פי 10 הפחתה בעלויות inference token בהשוואה לדור Blackwell, עם פריסות מתוכננות למחצית השנייה של 2026.

2026-04-22

NVIDIA חושפת את סדרת Nemotron 3 כ-open-source עם חמישה שיפור ב-inference

NVIDIA הכריזה על שחרור קוד פתוח של סדרת מודלים Nemotron 3, עם שיפורים ארכיטקטוניים משמעותיים שמספקים ביצועי inference מהירים פי חמישה לעומת הדורות הקודמים. המודלים מתוכננים לרוץ ביעילות על החומרה החדשה של NVIDIA תוך שמירה על דיוק תחרותי ב-benchmarks מרכזיים.

2026-04-21

סטארטאפ ה-AI Cursor במשא ומתן לגיוס של 2 מיליארד דולר בהערכה של מעל 50 מיליארד דולר

סטארטאפ הבינה המלאכותית Cursor נמצא במגעים לגייס סיבוב השקעה של 2 מיליארד דולר בהערכה של מעל 50 מיליארד דולר. Andreessen Horowitz צפוי להוביל יחד את סיבוב ההשקעה החדש, כשגם NVIDIA ו-Thrive Capital צפויים להשתתף. שלושת הקרנות כבר תמכו בעבר בסטארטאפ הקוד המבוסס AI.

2026-04-21

מתחרי שבבי AI מושכים מימון שיא של 8.3 מיליארד דולר כש-Cerebras מגישה בקשה ל-IPO

סטארט-אפים של שבבי AI ברחבי העולם גייסו שיא של 8.3 מיליארד דולר ב-2026 כאשר התחרות נגד NVIDIA מתגברת. Cerebras חשפה את תיק ה-IPO האמריקני שלה, במטרה לאתגר את NVIDIA עם שבבי inference הנמנעים מצווארי בקבוק של זיכרון bandwidth גבוה, בגיבוי שותפות 20 מיליארד דולר עם OpenAI.

2026-04-20

מניית NVIDIA עברה את $200 כש-Vera Rubin Platform צופה הכנסות של טריליון דולר עד 2027

מניות NVIDIA עברו את 200 דולר לראשונה מאז נובמבר 2025, מונעות על ידי תחזיות ג'נסן הואנג לגידול אקספוננציאלי בדרישות חישוב agentic AI. פלטפורמת Vera Rubin צפויה כעת לייצר טריליון דולר הכנסות מצטברות עד 2027, פי שניים מהערכות קודמות.

2026-04-19

NVIDIA השיקה אופטימיזציות מלאות לאינפרנס agentic עם פלטפורמת Dynamo

NVIDIA פרסמה טכניקות אופטימיזציה ל-agentic AI inference, תוך הדגשת אימוץ בעולם האמיתי כאשר Stripe מייצרת 1,300+ PR-ים בשבוע באמצעות agent-ים ו-Ramp מייחסת 30% מה-PR-ים הממוזגים ל-agent-ים. פלטפורמת Dynamo מתמודדת עם לחץ KV cache בworkflow-ים של agent-ים עם 85-97% hit rate במטמון.

2026-04-19

NVIDIA השיקה את Isaac GR00T N1.7 מודל VLA פתוח לחשיבה ברובוטיקה הומנואידית

NVIDIA הכריזה על Isaac GR00T N1.7, מודל חשיבה פתוח Vision-Language-Action (VLA) שתוכנן לשליטה וחשיבה רובוטית הומנואידית. המודל מקדם יכולות AI embodied, מאפשר לרובוטים להבין קלט ויזואלי, לחשוב על משימות ולבצע פעולות מורכבות, מסמן התקדמות לכיוון מערכות רובוטיות למטרות כלליות.

2026-04-18

NVIDIA משיקה Ising: מודלי AI פתוחים ראשונים לחישוב קוונטי עם דיוק מוביל בתעשייה

NVIDIA שחררה את Ising, הממוצג כמודלי AI open-source הראשונים בעולם למחשוב קוונטי, המכוונים לתיקון שגיאות וכיול מעבדים. מודל Ising Decoding מהיר פי 2.5 ומדויק פי 3 יותר מהסטנדרטים הנוכחיים בתעשייה. NVIDIA מספקת workflows נלווים, נתוני אימון ושירותי NIM microservices המאפשרים למפתחים fine-tune מקומי תוך הגנה על נתונים קנייניים.

2026-04-16

Benchmarks של Blackwell Ultra GB300 מציגים שיפור throughput של 50% על פני H100

NVIDIA פרסמה מפרט תפוקת inference מפורט עבור Blackwell Ultra GB300, המדגים 50% יותר tokens לשנייה מ-H100 SXM על עומסי transformer סטנדרטיים. ה-GB300 כולל זיכרון HBM3e של 288GB לכל GPU, המאפשר הגשה של מודלים בכיתת 70B ללא tensor parallelism. זמינות בענן דרך AWS, Azure ו-Google Cloud צפויה ברבעון השלישי של 2026.

2026-04-16

מיקרו-שירותי NVIDIA NIM עודכנו למודלים מתקדמים עם פריסה בלחיצה אחת

NVIDIA הכריזה על הרחבת קטלוגי מיקרו-שירות NIM המכסים כעת Llama 4, Gemini ונקודות קצה Claude מעודכנות, מה שמאפשר לארגונים לפרוס מודלים חזיתיים on-premises עם backend inference TensorRT-LLM מיטוב מוקדם. העדכון כולל שילוב guardrails חדש דרך NeMo Guardrails 0.11 ותמיכה ב-inference רב-צמתי על cluster H100 ו-B200. מפתחים המשתמשים ב-NVIDIA AI Enterprise יכולים לגשת ל-NIM אלה דרך קטלוג NGC עם תמיכה מגובה SLA.

2026-04-14

NVIDIA אישרה תמיכה ב-RTX PRO Blackwell GPU למחשוב AI קצה

Premio אימתה תמיכה ב-GPU של NVIDIA RTX PRO Blackwell על פני פתרונות edge computing שלה, עם ה-GPUs החדשים שמספקים עד 3,511 TOPS ועד 24,064 ליבות CUDA לעומסי עבודה inference ו-AI גנרטיבי. האימות מאפשר יכולות AI מואצות ב-edge, תמיכה בדרישות עיבוד זמן אמת לפריסות תעשייתיות וארגוניות. ארכיטקטורת RTX PRO Blackwell מספקת שיפורי ביצועים משמעותיים ליישומי AI ב-edge תוך שמירה על דרישות יעילות כוח לסביבות מחשוב מפוזרות.

2026-04-13

מעצבת שבבי RISC-V SiFive הגיעה להערכת 3.65 מיליארד דולר עם גיבוי NVIDIA

מעצבת השבבים SiFive הנתמכת על ידי NVIDIA הגיעה להערכה של 3.65 מיליארד דולר בסיבוב המימון האחרון שלה, מה שמייצג צמיחה משמעותית מהערכת pre-money של 2.33 מיליארד דולר במרץ 2022 כשגייסה 175 מיליון דולר. SiFive שומרת על ארכיטקטורות שבב פתוחות ולא-קנייניות תוך שימוש בסט הוראות RISC-V, שמציבה אותה כספקית נייטרלית לפיתוח תשתית AI. העלייה המהותית בהערכה משקפת ביקוש גובר לארכיטקטורות מעבד חלופיות כשחברות מחפשות גמישות ועצמאות מפתרונות מבוססי x86 ו-ARM מסורתיים לעומסי עבודה AI.

2026-04-13

NVIDIA חושפת פלטפורמת AI chip דור הבא 'Rubin' עם לוח זמנים מואץ לפיתוח

NVIDIA הכריזה על הדור הבא של שבבי AI שלה, פלטפורמת 'Rubin', הכוללת GPU מעודכנים ומעבד מרכזי חדש בשם 'Vera', חודשים בלבד לאחר מודל Blackwell. החברה התחייבה ל'קצב של שנה אחת' להוצאת מודלי שבב AI חדשים, מסמנת את הקצב המואץ של פיתוח השבבים של NVIDIA כדי לשמור על הדומיננטיות בשוק. בינתיים, סטודיו הפיתוח S-Game Studio התרחקה בפומבי מ-DLSS 5 עבור Phantom Blade Zero, תוך ציון דאגות שטכנולוגיית ויזואל AI גנרטיבית עלולה לשנות את הכוונה היצירתית המקורית של האמנים, מה שמשקף התנגדות גוברת לויזואלים שנוצרו על ידי AI במשחקים.

2026-04-12

NVIDIA השיקה את NIM Agentic Framework וכלי AITune לאופטימיזציה של AI inference

NVIDIA שחררה את NIM Agentic Framework, המספק שיפורי throughput פי 5 ל-AI agents כבדי reasoning דרך speculative decoding שמזווג מודלי draft קטנים עם מודלי verifier גדולים יותר. ה-framework משתלב עם TensorRT, TensorRT-LLM, vLLM ו-SGLang ברחבי deployments של cloud, data center ו-RTX AI PC, עם שותפות LangChain שמסמנת נתיבי אימוץ enterprise. בנפרד, NVIDIA השיקה את AITune, ערכת inference open-source שמזהה אוטומטית את ה-backend המהיר ביותר (TensorRT, Torch-TensorRT, TorchAO) לכל מודל PyTorch תוך אימות נכונות, ומטפלת בפער המתמשך בין מודלי מחקר ל-deployments production. בנוסף, NVIDIA חשפה את פלטפורמת צ'יפ ה-AI שלה 'Rubin' עם GPUs מעודכנים ומעבד מרכזי 'Vera' חדש, תוך שמירה על קצב שחרור שנתי לחיזוק הדומיננטיות בשוק.

2026-04-11

NVIDIA משלבת פלטפורמת Jetson למשימת Firefly Aerospace הירחית ומספקת שיפורי ביצועים ב-NIM 1.4

Firefly Aerospace הכריזה על שיתוף פעולה עם NVIDIA לשילוב פלטפורמת Jetson בחללית Elytra שלה לעיבוד תמונות ירח ברזולוציה גבוהה במסלול במהלך Blue Ghost Mission 2 הקרובה, המתוכננת לסוף 2026. מחסנית התוכנה של NVIDIA, הבנויה על CUDA, תפעיל מודלי AI לשירות הדמיה ירחי, מה שיאפשר מיפוי חוזר וגילוי שינויים. בנוסף, עדכון NIM 1.4 microservices של NVIDIA השיג רווחי throughput של פי 2.6 על חומרת H100, והגיע ל-1,201 token/sec ב-Llama 3.1 8B מול 613 token/sec בפריסות סטנדרטיות, תוך תמיכה במנועי inference מותאמים המתעדכנים באופן רציף למשפחות מודלים DeepSeek, LLaMA, Mistral ו-SDXL.

2026-04-10

CoreWeave ו-Meta הרחיבו העסקה ב-cloud ל-21 מיליארד דולר עם NVIDIA Rubin; NVIDIA נכנסת לחלל וסייבר

CoreWeave ו-Meta הכריזו על הסכם מורחב של 21 מיליארד דולר לתשתיות cloud AI, עם CoreWeave כאחד הספקים הראשונים של GPU Rubin דור הבא של NVIDIA לפריסה של inference, reasoning ו-agentic בהיקף גדול. בהקביל, NVIDIA הכריזה על זמינות כללית של GB200 NVL72 rack-scale המשלבות 72 GPU Blackwell עם ביצועי 1.4 exaflops ב-FP4 inference, עם פריסות ב-AWS, Azure ו-Google Cloud מתוכננות ל-Q2 2026. NVIDIA גם משתפת פעולה עם Firefly Aerospace ו-Planet Labs לעיבוד AI בזמן אמת בלוויים וצפיית כדור הארץ דרך Jetson, והצטרפה ל-Project Glasswing להגנה סייברנטית מופעלת בינה מלאכותית. נוסף על כך, NVIDIA ו-Siemens חשפו פתרון אימות שבבים שמסוגל לסימולציה של טריליוני מחזורים בימים, וה-SoC N1 הקרוב של NVIDIA לנייד AI עם 128 GB זיכרון פורט בפרטים.

2026-04-09

NVIDIA פרטה DLSS 5 עם דחיסה VRAM של 6.7x והוציאה Nemotron OCR v2 — מודל הכרה טקסט רב-לשוני

NVIDIA פרטה DLSS 5, טכנולוגיית עיבוד עצבי המציגה דחיסה המפחיתה שימוש VRAM מ-6.5GB ל-970MB לנתוני טקסטורה וחומר — הפחתה של כ-6.7x עם השלכות משמעותיות למפתחי משחק ויישום. החברה גם שותפת עם Siemens בפתרון אימות שבב AI המסוגל להדמות טריליוני מחזורים בימים, תוך הרחבת תשתית EDA מבוססת-GPU עם Synopsys ו-Cadence. בנפרד, NVIDIA הוציאה Nemotron OCR v2, מודל OCR רב-שפתי מצב-אמנות-ייצור המשלב חיישן, מכשיר, וגם מודל יחסי לניתוח פריסה, זמין בעסקי דרך אוסף NVIDIA NeMo Retriever.

2026-04-08

NVIDIA מקדמת AI אג׳נטי עם שיתוף פעולה Gemma 4, הדוגמנות בעלות NIM 2x, ודחיסת Neural Texture

NVIDIA ביצעה הודעות רבות השבוע: בשיתוף פעולה עם Google, היא הוציאה משפחת מודלים Gemma 4 אופטימלי לחומרה של NVIDIA ברחבי מכשירים מסמארטפונים לעד למערכות IoT, כולל מודל MoE הראשון של Gemma ל-agentic, on-device AI עם עיבוד נתונים מקומי בזמן אמת כדי להקטין latency ותלות בענן. NVIDIA NIM (Inference Microservices) הוא בעל throughput שיפורים 2x על GPUs H100 — benchmarked ב-1,201 tokens/second לעומת 613 ללא NIM על Llama 3.1 8B — תומכת ב-DeepSeek, Llama, Mistral, ו-SDXL על פני ענן, data center, וסביבות PC. בנוסף, NVIDIA הדגימה Neural Texture Compression (NTC) הורדת שימוש VRAM מ-6.5GB ל-970MB (הפחתה של ~85%), מיצוב דחיסה מונעת AI כמשלים ל-DLSS 5 שמתמקדות בעיתיות ולא בשחזור תמונה.

2026-04-07

NVIDIA תפרוס 1 מיליון+ GPUs Blackwell ו-Vera Rubin בחלקי AWS; דחיסה נוירונית מורידה VRAM מ-6.5GB ל-970MB

NVIDIA התחייבה לפרוס יותר ממיליון GPUs המשתרעים על פני ארכיטקטורות Blackwell והדור הבא Vera Rubin על פני אזורי ענן AWS גלובליים לאורך 2026, המייצגים קפיצה דור בתפוקה, בדיחוק ובעלות-לכל-token עבור זעקות Bedrock ו-SageMaker, עם failover inference חוצה-אזור המטפל בנקודות כאב בחסינות קודמות. בנפרד, NVIDIA הדגימה Neural Texture Compression (NTC) ו-Neural Materials (NM) המסוגלים להפחית שימוש VRAM מ-6.5GB ל-970MB, וה-DLSS 5 של דור ה-AI generative עם שחזור מסגרת חילק את קהילת המפתחים האם שחזור AI מחרוט כוונה אמנותית. NVIDIA גם שחררה את משפחת המודל Gemma 4 בשיתוף עם Google, עם וריאנטים מיטבים של NVIDIA הזמינים דרך NIM microservices inference ב-Hugging Face.

2026-04-06

NVIDIA Sets New MLPerf Inference Records: 2.5M Tokens/Sec on Blackwell Ultra, 3x Speedups and 60% VRAM Reduction via Software Optimizations

NVIDIA announced PyTorch-CUDA software optimizations achieving up to 3x performance improvements and 60% VRAM reduction for video and image generative AI workloads, with native NVFP4/FP8 precision support. Blackwell Ultra submissions reached a record 2.5M tokens/sec throughput in MLPerf inference benchmarks, while RTX AI infrastructure demonstrated 35% faster inference for small language models via Ollama and llama.cpp. NVIDIA also announced optimizations for Google's Gemma 4 on RTX PCs, DGX Spark, and edge devices, and introduced new local agent models including Nemotron 3 Nano 4B and Nemotron 3 Super 120B. Separately, NVIDIA's DLSS 5 and Neural Texture Compression technology — reducing VRAM from 6.5GB to 970MB — are facing backlash from game developers who label AI-generated frames 'AI slop,' with Jensen Huang publicly defending the technology.

2026-04-04

עוד ספקים

Anthropic OpenAI Google AWS Azure Meta xAI Mistral Apple Hugging Face Alibaba DeepSeek Samsung

← לכל הכתבות