xAI משיקה מצב '/goal' ב-Grok Build למשימות קוד אוטונומיות ומאומתות

xAI הוסיפה פקודת '/goal' ל-Grok Build, ה-agent שלה לכתיבת קוד שפועל מהטרמינל, ובכך אפשרה הרצה אוטונומית ארוכת-טווח עם verification מובנה. במקום לפקח על כל צעד, מפתח/ת יכול/ה למסור ל-agent מטרה ברמה גבוהה — מיגרציה של מודול, refactor, מימוש שפרוס על כמה קבצים — ולתת לו לעבוד עד הסוף תוך שהוא בודק את ההתקדמות שלו מול היעד. Elon Musk הגביר את שדרוגי Grok Build ב-X (11,940 לייקים).
רכיב ה-verification הוא ההבדל ש-xAI מדגישה: agents בעלי אופק ארוך ידועים לשמצה בכך שהם 'משלימים' בביטחון משימות שבפועל לא עוברות, ולכן שילוב בדיקת השלמה בתוך הלולאה מכוון בדיוק לפער האמינות שמגביל כתיבת קוד אוטונומית בproduction. זה מציב את Grok Build ישירות מול Claude Code, Codex של OpenAI (שזה עתה נפרס ב-Samsung) ו-GitHub Copilot CLI במרחב הצפוף-יותר-ויותר של agents בטרמינל.
xAI שילבה את ההשקה עם מהלכים רחבים יותר במערכת האקולוגית — Grok 4.3 נכנס ל-GA על Amazon Bedrock עם context של 1M tokens, ואינטגרציה חדשה של Grok עם Interactive Brokers לנתוני תיק השקעות. הקריאה האסטרטגית היא ש-xAI רוצה ש-Grok יהיה כלי פיתוח אמין, לא רק chatbot. הספקנים יציינו שטענות על 'הרצה אוטונומית מאומתת' קל לטעון וקשה לאמת; ההוכחה תהיה ב-benchmarks עצמאיים ובשאלה האם מפתחים יסמכו על /goal בקודבייסים אמיתיים ולא רק ב-refactors של צעצוע.