Google2026-04-28

ה-TPU v8 של Google מתפצל לשבבי training ו-inference נפרדים

ניתוח AI

ב-Cloud Next 2026 Google הציגה את ה-TPU מהדור השמיני בפעם הראשונה כמשפחה דו-chip: TPU 8t לאימון מודלים בקנה מידה גדול ו-TPU 8i מותאם ל-inference וב-reasoning בלטנציה נמוכה. הפיצול נועד להוריד את כלכלת ה-inference מתחת ל-NVIDIA Blackwell על workloads של context ארוך ו-reasoning כבד, ומשולב עם עבודה חדשה של DeepMind על Decoupled DiLoCo לאימון מבוזר עמיד.