GoogleMay 19, 20261 מקורות

Logan Kilpatrick חושף את Gemini Omni: "ליצור הכל מכל קלט" — מתחילים בווידאו

ניתוח AI

Logan Kilpatrick, ראש Google AI Studio, פרסם ב-19 במאי (5,772 לייקים, 528 ריטוויטים) את המיצוב הברור ביותר עד כה של Gemini Omni: מודל any-modality-in / any-modality-out שיוצר 'כל דבר מכל input', וממוצב באופן שיחתי כ-'Nano Banana אבל לוידאו' — התייחסות למודל יצירת התמונות של Google. Omni יוצא ראשון באפליקציית Gemini, ב-Flow (כלי יצירת הסרטים של Google) וב-YouTube, כאשר גישת API תגיע בגל מאוחר יותר.

החשבון של Google DeepMind השלים בפרטים קונקרטיים על אינטגרציית Flow: Gemini Omni מוסיף עריכת batch ושיפור עקביות דמויות ל-Flow, כלי הוידאו AI הקולנועי ש-Google השיקה ב-I/O 2024. הפוסט השני (330 לייקים, 40 ריטוויטים) מאשר את זווית הפרודקשן — יצירת הוידאו של Omni ממוקדת ביוצרים נרטיביים/קולנועיים ראשית, ולא בשוק ה-'text-to-video לכולם' הגנרי שכבר צפוף עם Sora, Runway ו-Veo.

העובדה החדשה מאז כיסוי ה-keynote של I/O אתמול: משטח מוצר מאושר (App + Flow + YouTube), מיצוב מאושר ('Nano Banana לוידאו'), ורצף rollout מאושר ל-API (קודם צרכן, אחר כך מפתח). הערות של Simon Willison על Gemini 3.5 Flash (164 לייקים ב-X) הציפו גם את הקשר התמחור של היום: פי 3 ממחיר Gemini 3 Flash, כאשר Google מתכננת להשתמש בו במוצרים רבים שלה — מה שמוביל את קהילת המפתחים לציין ש-Google מנרמלת תמחור גבוה יותר ל-Gemini API במקביל לדחיפה הצרכנית.

תחרותית, Omni-on-YouTube היא הזווית המעניינת ביותר. ה-AI likeness detection המורחב של YouTube (שיצא אותו שבוע) ועכשיו יצירת Gemini Omni נייטיבית בתוך YouTube יאפשרו ל-Google להציע יצירה-וזיהוי end-to-end בתוך פלטפורמה אחת — משהו שאף יריבה לא יכולה להציע. הקריאה הספקנית של מפתחים בשרשורים סמוכים ל-Simon Willison: שילוב של קפיצת מדרגת תמחור ועיכוב גרסת ה-Pro רומז ש-Google ממנפת מונטיזציה חזק יותר, וצרכנים עשויים להגיב ברתיעה כשציפיות המנוי החודשי יחצו את ה-100$.

מקורות

threads.com

https://www.threads.com/@logankilpatrick/post/DYh33JTApIU/video-introducing-gemini-omni-omni-is-our-new-model-that-can-create-anything-from-any