מודל o3 של OpenAI מפצח אבחון מחלות נדירות — במחקר ב-NEJM AI

מחקר שעבר peer-review ב-NEJM AI דיווח שמודל ה-reasoning o3 של OpenAI עזר לרופאים בבית החולים לילדים בבוסטון להגיע לאבחנות חדשות עבור יותר מ-18 ילדים שמצבם חמק מהרופאים במשך שנים. הקבוצה כללה 10 חולים עם מחלות נוירו-התפתחותיות נדירות וארבעה עם הפרעות נוירו-שריריות — מקרים שבהם מסלולי האבחון המקובלים נתקעו. התוצאה היא אחד מהאימותים הקליניים הקונקרטיים יותר של מודלי reasoning מובילים ברפואה בעולם האמיתי.
מבחינה מעשית, הערך של o3 בהקשר הזה נובע מהיכולת שלו לסנתז מצגי תסמינים מסועפים ולא טיפוסיים ולהעלות אבחנות מועמדות למצבים נדירים שמומחים בודדים אולי נתקלים בהם לעיתים רחוקות. המודל מתפקד כ-copilot אבחוני ולא כמקבל החלטות אוטונומי, כשהרופאים מאמתים את הצעותיו.
תמה של AI רפואי תופסת תאוצה השבוע: מנכ"ל Microsoft AI, Mustafa Suleyman, אמר למראיין ש'ביישום של AI, תחום הבריאות יהיה ההתפוצצות הבאה של product-market-fit', וציטט את שיתוף הפעולה של Microsoft עם Mayo Clinic. בנפרד, OpenAI גם חשפה שיטת הערכה חדשה שנועדה לחזות התנהגות AI מזיקה לפני ה-deploy — מחווה בולטת לבטיחות על רקע ההשלכות של בקרת הייצוא אצל Anthropic השבוע.
למה לשים לב הלאה: האם תוצאות האבחון ישוחזרו על פני אוכלוסיות חולים גדולות ומגוונות יותר, איך רגולטורים יתייחסו למודלי reasoning בתמיכת החלטות קלינית, והאם מודלים מתחרים (Gemini, Claude) יפרסמו תוצאות קליניות דומות שעברו peer-review.