אחרי עסקת ה-20 מיליארד של Nvidia: סטארטאפ השבבים Groq מגייס 650 מיליון

סטארטאפ שבבי ה-AI בשם Groq מגייס לפי הדיווחים 650 מיליון דולר ממשקיעים קיימים כדי להרחיב את עסקי ענן ה-inference שלו, זאת בעקבות מהלך ה'לא-רכישה-לטובת-כישרון' של Nvidia בסכום מדווח של 20 מיליארד דולר. את הסבב מוביל המנכ"ל/סמנכ"ל הכספים הזמני Adam Winter, לפי TechCrunch, מה שמסמן שגם אחרי עסקת הכישרון-והטכנולוגיה הענקית של Nvidia, השאיפות העצמאיות של Groq בתחום ענן ה-inference ממשיכות עם הון טרי.
המבנה מעניין: 'לא-רכישה-לטובת-כישרון' בסכום של 20 מיליארד דולר — שבה Nvidia סופחת כישרון וטכנולוגיה מרכזיים בלי רכישה מלאה — ולאחריה סבב צמיחה נפרד של 650 מיליון דולר מרמזת שישות ענן ה-inference של Groq ממשיכה לפעול כעסק חי. המסר השיווקי של Groq היה תמיד inference בעל latency נמוך במיוחד בזכות ארכיטקטורת ה-LPU שלו, ממוצב מול שירות מבוסס GPU עבור עומסי עבודה רגישי-latency ובעלי throughput גבוה.
מבחינה מנגנונית, העיתוי משתלב עם הסטת הענף לכיוון כלכלת ה-inference. ככל שארגונים נאבקים בחשבונות token שיוצאים משליטה (הצרת הצעדים של Amazon נגד 'tokenmaxxing', המסר השיווקי של Google סביב Flash), חומרת inference ייעודית שמורידה את העלות-per-token הופכת לבעלת ערך אסטרטגי — מה שמסביר גם את ההתעניינות של Nvidia וגם את ההון הטרי.
תחרותית, ההסדר שומר את Groq בשוק תוך מתן אופציונליות inference ל-Nvidia וגידור המודל ממוקד-ה-GPU שלה. הספקנים יטילו ספק במבנה העסקה החריג ובשאלה האם גיוס של 650 מיליון דולר יכול באמת להגדיל ענן inference מול ההצעות של Nvidia עצמה ושל שירותי ה-inference המנוהלים של AWS/Azure/Google. שווה לעקוב אחר אופן הפריסה של ההון, האם הקשר עם Nvidia מגביל או מאפשר את עסקי הענן, וכיצד מחזיקה כלכלת מומחי ה-inference מעמד ככל שמודלי החזית ממשיכים לחתוך מחירים.