GoogleJune 12, 20261 מקורות

Google מביאה את Lyria 3 ל-Gemini: יצירת מוזיקה ארוכה באיכות גבוהה

ניתוח AI

Lyria 3 מסמן קפיצת מדרגה ב-AI הקולי: משתמשים יכולים לייצר קטעים נאמנים ברזולוציה גבוהה וארוכים — עד שלוש דקות — מתוך prompts של טקסט או תמונה ישירות בתוך אפליקציית Gemini. Google אומרת שהמודל מצטיין בהבנת אלמנטים מוזיקליים יסודיים — מבנה, סולם, מקצב — ובהבטחת מעברים חלקים לאורך יצירה שלמה במקום הפקת קטעים מנותקים.

מנגנון הבטיחות בולט: סימון מים מסוג SynthID מוטמע כך שניתן לזהות תוכן שנוצר ב-AI אפילו לאחר עריכות, ניסיון להקדים את החששות בנושאי מקור וזכויות יוצרים שרודפים את האודיו הגנרטיבי. זה ממצב את Google כמי שנוקטת עמדה זהירה וניתנת למעקב יותר מחלק מהמתחרים בתחום טעון משפטית.

תחרותית, Lyria 3 מתמודד מול Suno, Udio ומאמצי האודיו של Stability, כשהיתרון של Google הוא הפצה מובנית בתוך המשטח הצרכני של Gemini ואינטגרציה עם ה-stack הרב-מודלי הרחב שלה. הבאת פלט באיכות מקצועית ובאורך שלוש דקות לאפליקציה מיינסטרים מורידה את החסם ליוצרים באופן ניכר.

השאלות הפתוחות מוכרות לתחום מוזיקת ה-AI: רישוי נתוני האימון, כיצד יגיבו חברות התקליטים והאמנים, והאם סימון המים ישרוד re-encoding ו-remix במציאות. בינתיים זהו סימן ברור ש-Google מתכוונת להתחרות בכל מודאליות גנרטיבית — טקסט, תמונה, וידאו (Gemini Omni Flash הוביל את Video Arena השבוע), וכעת גם אודיו.

מקורות

aimagazine.com

https://aimagazine.com/news/lyria-3-google-deepminds-high-fidelity-sonic-revolution