OpenAI מוסיפה SynthID, Content Credentials של C2PA ו-verifier ציבורי

ב-19 במאי הכריזה OpenAI (4,018 לייקים, 370 ריטוויטים ב-X) שתמונות שנוצרות על-ידי ChatGPT נושאות כעת גם C2PA Content Credentials וגם את ה-watermark של SynthID מבית Google, וגם השיקה כלי אימות ציבורי שמאפשר לכל אחד לבדוק אם תמונה נוצרה על-ידי ChatGPT. OpenAI גם פרסמה פוסט מחקר על content provenance באתר openai.com שמפרט איך המערכת אמורה לעבוד end-to-end.
ה-stack הטכני דו-שכבתי. C2PA Content Credentials הם תגיות metadata חתומות קריפטוגרפית שמוטמעות בקובץ התמונה — חסונות אם נשמרות, אך שבירות תחת recompression או screenshot. SynthID הוא watermark סטגנוגרפי ברמת פיקסל מבית Google DeepMind, שהיה במקור קנייני למודלי התמונות של Google, ושורד טרנספורמציות סטנדרטיות כולל cropping, screenshot וסינון מתון. שכבוב שלהם פירושו ש-provenance ניתן לזיהוי גם דרך metadata (קל, מדויק) וגם דרך watermark (קשה יותר, חסון).
המשמעות החוצה-מעבדות היא הכותרת. SynthID היה הבידול המחקרי של Google; אימוץ שלו על-ידי OpenAI הוא המקרה המשמעותי הראשון של מעבדת frontier סגורה שמרשה לעצמה לרשות או לאמץ stack בטיחות של יריבה. שרשור ב-HN עם 326 נקודות ו-176 תגובות ציין שזה רגע יישור standards נדיר — מפתחים מיצבו את זה כאנלוגי להסכמת Apple ו-Google על API לזיהוי קונטקטים שומר-פרטיות ב-2020.
הקריאות הספקניות חדות. Watermarks שורדים טרנספורמציות תמימות, אבל יריבים נחושים יכולים להסיר אותם, ו-'authenticated by ChatGPT' אינו זהה ל-'לא נוצר על-ידי מודל אחר'. עבור deepfakes ברמת סיכון גבוהה — דימויים פוליטיים, הונאה — השאלה החשובה יותר היא אם בכלל מישהו בודק provenance לפני שיתוף. השקת ה-likeness detection המורחב של YouTube השבוע היא המקבילה בצד הצרכני: זיהוי במקום שבני אדם באמת צורכים בו תוכן. ביחד, אלה המהלכים הקונקרטיים ביותר ב-provenance מאז ש-C2PA הוצע לראשונה, אך בעיית ה-social engineering שאותה הם אמורים לפתור עדיין לא נפתרה ברובה.