הסיכום היומי של החדשות החשובות ביותר ב-AI: פריצות דרך, השקות, מימון ורגולציה — לתעשייה, מפתחים, מייסדים ומשקיעים.
הסיפורים של היום
Claude Opus 4.8 כאן: adaptive thinking, context של 1M tokens ו-Fast mode זול פי 3
ספק: Anthropic
Anthropic השיקה את Claude Opus 4.8, הדגל המשודרג שלה, עם התאמת reasoning effort דינמית, context window של 1M tokens וביצועים משופרים בקוד ובמשימות ידע — והכל באותו תג מחיר ($5/M input, $25/M output). מצב Fast זול פי 3 ומהיר פי 2.5. ההשקה כבשה את Hacker News עם 1729 נקודות ו-1346 תגובות, וכבר זמינה ב-AWS Bedrock, Perplexity Max, Kiro IDE ו-Vertex.
Anthropic עוקפת את OpenAI: 65 מיליארד דולר גיוס לפי שווי של 965 מיליארד
ספק: Anthropic
Anthropic סגרה סבב Series H של $65B לפי שווי של $965B post-money, ועקפה לרגע את OpenAI כמעבדת ה-AI הפרטית היקרה בעולם. הסבב חופף להשקת Opus 4.8 ול-ARR מדווח של $47B, אם כי אנליסטים תוהים אם ההכנסות מנופחות מ-inference ולא באמת ברות-קיימא.
AWS Bedrock פותחת את הארנק ל-AI: AgentCore Payments מאפשר עסקאות דרך x402
ספק: AWS
AWS חשפה את AgentCore Payments בתוך Amazon Bedrock — שירות שמאפשר ל-AI agents לגלות, להעריך ולשלם באופן עצמאי על תוכן, APIs ושירותים ברשת, דרך פרוטוקול x402. ה-preview נבנה בשיתוף Coinbase (תשתית ארנקים) ו-Stripe (פסי תשלום), במטרה להפוך agents ל'פעילים כלכלית' בתוך לולאת הרצה אחת.
Microsoft מתרחקת מ-OpenAI: Copilot הופך ל-super app ומודל coding פנימי ב-Build
ספק: Azure
לפי Fortune, Microsoft בונה Copilot 'super app' שיאחד קוד, צ'אט וכלי AI למוצר אחד, ובמקביל The Information מדווח שמודל קוד פנימי חדש של Microsoft יחשף בשבוע הבא בכנס Build. מניית MSFT עלתה כ-3% בעקבות החדשות על מודל הקוד, כשהחברה מסמנת בבירור מרחק מ-OpenAI, Anthropic ו-Google.
ChatGPT Codex כובש את Windows: Computer Use ושליטה מרחוק מ-iOS ו-Android
ספק: OpenAI
OpenAI הרחיבה את Computer Use באפליקציית ChatGPT Codex ל-Windows, ומאפשרת למשתמשים זכאים לתת ל-ChatGPT לתפעל ישירות אפליקציות Windows לבדיקה, debugging וליטוש קוד. אפשר גם לשלוט מרחוק במחשב Windows דרך ChatGPT mobile או Codex על Mac. העדכון מוסיף Codex Profiles למעקב פעילות וצריכת tokens.
Gemini Embedding 2 של DeepMind: RAG מולטימודלי native על טקסט, תמונה, וידאו, אודיו וקוד
ספק: Google
Google DeepMind השיקה את Gemini Embedding 2, מודל embedding multimodal נייטיב שזמין דרך Gemini API ו-Vertex AI. הוא תומך ב-retrieval על טקסט, תמונה, וידאו, אודיו, מסמכים וקוד, ו-Google טוענת ל-state-of-the-art על מספר benchmarks — מכוון ישירות ל-RAG מתקדם וחיפוש multimodal.
Mistral יוצאת לצרכנים: agent בשם Vibe ו-Industrial stack על Medium 3.5 בגודל 128B
ספק: Mistral
Mistral AI ביצעה rebrand לעוזר הצרכני שלה ל-'Mistral Vibe' (עם Work Mode למשימות ארוכות ו-Code Mode לקוד מרחוק) והשיקה את 'Mistral for Industrial Engineering' שמשלב LLMs עם סימולציית פיזיקה של Emmi AI. שניהם רצים על הדגל החדש Mistral Medium 3.5 — מודל dense של 128B שאפשר לעשות לו self-host על 4 GPUs בלבד. בנוסף Mistral הכריזה על data center של 10MW ל-inference ב-Les Ulis ועל אינטגרציה ל-Microsoft Copilot Studio.
Qwen3.7-Max של Alibaba מטפס למקום 4 ב-Code Arena WebDev — מעל OpenAI ו-Google
ספק: Alibaba
Qwen3.7-Max של Alibaba הגיע למקום ה-4 בטבלת WebDev של Code Arena — היחיד מחוץ לארה"ב בחמישייה הראשונה (אחרי כמה מודלים של Claude), והביס מודלים פרודקשן של OpenAI ו-Google בבניית web apps. Alibaba גם דיווחה ש-Qwen3.5 הגיע ל-580 tps על מנוע TokenSpeed.
Apple מתכוננת ל-WWDC: Siri חדשה לגמרי, וייתכן ש-Google Gemini מאחורי הקלעים
ספק: Apple
Apple מתכוננת לשדרוג דרמטי של Siri ל-WWDC 2026 שיהפוך אותה ל-AI agent של ממש למשימות מרובות-שלבים. לפי הדיווחים ה-Siri החדשה תופעל על ידי Google Gemini (עם אופציות לספקי AI נוספים) ותכלול אפליקציה ייעודית, אינטגרציה ל-Dynamic Island ועריכת תמונות עם AI. במקביל Bloomberg מדווח ש-OpenAI שוקלת צעדים משפטיים נגד Apple בגלל אינטגרציית ChatGPT-Siri שנתקעה.
xAI משיקה grok-build-0.1 ומבטיחה Grok 4.2 כ-open-source עד סוף השנה
ספק: xAI
xAI השיקה את grok-build-0.1 ב-public beta דרך xAI API במחיר $1/M input ו-$2/M output — המודל שמפעיל את כלי ה-agentic coding בשם Grok Build CLI — והשיקה דף יומי למעקב ציבורי אחרי ה-builds. במקביל Elon Musk התחייב לשחרר את Grok 4.2 base (0.5T parameters) כ-open-source עד סוף 2026, כאשר Grok 5 יאומן על cluster ה-Colossus 2 עם 500,000 GPUs.
NVIDIA מגדילה ל-150 מיליארד דולר בשנה בטייוואן ומתחילה משלוחי Vera CPU ראשונים
ספק: NVIDIA
Jensen Huang אמר ש-NVIDIA מעלה את ההוצאה השנתית על ייצור ו-supply chain בטייוואן מ-$100B ל-$150B כדי לעמוד בביקוש ל-AI, כאשר מעבדי Vera הראשונים כבר נשלחים למעבדות AI מובילות ולענן. Huang רמז על מסלול ל-$3T בהכנסות שיונע על ידי agentic inference. חשבון ה-X של NVIDIA AI גם הקניט 'עידן חדש של PC'.
מתקפת supply-chain על משתמשי Claude: חבילת npm זדונית בשם mouse5212-super-formatter
ספק: Anthropic
חבילת npm זדונית בשם 'mouse5212-super-formatter' נתפסה כשהיא מוציאה קבצים מתיקיית המשתמש של Claude AI אל repo GitHub בשליטת תוקף, מחופשת לכלי ארכוב ורצה ב-postinstall. המקרה מדגיש את סיכון ה-supply chain ב-workflows של פיתוח AI, על רקע האימוץ המואץ של Claude Code.
Robinhood פותחת את הפלטפורמה ל-AI agents שסוחרים במניות
ספק: Other
Robinhood פתחה את הפלטפורמה שלה ל-AI agents שסוחרים במניות בשם משתמשים, אחד הפריסות הפרודקשן הראשונות של agentic finance בברוקר קמעונאי גדול. המהלך עורר שאלות של חובת נאמנות, אחריות ו-governance ב-thread של Hacker News עם 91 נקודות ו-166 תגובות.
Hugging Face עושה open-source לרובוט הומנואיד להדפסה תלת-ממדית ב-2,500 דולר
ספק: Hugging Face
Hugging Face שחררה כ-open-source תוכניות מלאות לרובוט humanoid דו-רגלי שעלות החלקים שלו כ-$2,500. העיצוב משתמש ב-75 קבצי הדפסת 3D, אקטואטורים ואלקטרוניקה סטנדרטיים ומודל CAD ציבורי ב-Onshape לבדיקה ושינוי — הרחבה של פרויקט LeRobot לפורמט humanoid.
Liquid AI משיקה את LFM2.5-8B-A1B — MoE שאומן על 38 טריליון tokens
ספק: Other
Liquid AI חשפה מודל mixture-of-experts בגודל 8B-A1B שאומן על 38 טריליון tokens, ומחממת את מרוץ המודלים הקטנים-יעילים. השחרור גרף 159 נקודות ב-Hacker News כעוד מתמודד small-MoE שמאתגר את מודלי ה-dense הוותיקים.