Mistral AI משיקה את מודל OCR 4 להבנת מסמכים על Microsoft Foundry ו-AWS

Mistral AI השיקה את Mistral OCR 4, מודל מתקדם לבינת מסמכים שמחלץ נתונים מובנים ממסמכים לא-מובנים ב-170 שפות. המודל מספק bounding boxes ברמת הפסקה, תיוג בלוקים לפי סוג, וציוני confidence — יכולות שתוכננו במיוחד לשפר pipelines של retrieval-augmented generation (RAG), שבהם פירוק מדויק של מסמכים קובע ישירות את איכות התשובות.
הגישה של פלט מובנה חשובה ל-RAG ארגוני: bounding boxes ובלוקים מתויגים מאפשרים למערכות במורד הזרם לשמר את הפריסה והסמנטיקה של המסמך במקום לשטח הכל לטקסט גולמי, בעוד ציוני ה-confidence מאפשרים סקירה אנושית סלקטיבית של חילוצים בעלי ודאות נמוכה. הכיסוי של 170 שפות מכוון לארגונים גלובליים עם מאגרי מסמכים רב-לשוניים.
Mistral OCR 4 זמין מיידית דרך ה-API של Mistral, Mistral Studio, Amazon SageMaker ו-Microsoft Foundry, במחיר של 4 דולר לכל 1,000 עמודים בגישת API סטנדרטית. ההפצה הרב-עננית — הנחיתה במקביל על הפלטפורמות של AWS ושל Microsoft — משקפת את האסטרטגיה של Mistral להיות זמינה בכל מקום שבו ארגונים כבר פועלים, במקום לכפות תלות בספק.
בינת מסמכים היא נישה תחרותית וחשובה מסחרית, שעליה מתמודדים שירותי OCR ילידי-ענן, ספקים ייעודיים ומודלי vision כלליים. ההימור של Mistral הוא שמודל OCR ייעודי ומותאם ל-RAG עם פלט מובנה מנצח מודלי vision כלליים בדיוק, ומנצח OCR ותיק בכיסוי שפות ובהבנת פריסה. בנפרד, מחקר ב-Nature על יצירת דוחות תרופתיים קליניים ציין את מודלי Mistral בין הארכיטקטורות שנעשה בהן שימוש, מה שמשקף אימוץ גובר של המודלים הפתוחים של Mistral בתיעוד רפואי. שווה לעקוב אחר השוואות דיוק עצמאיות מול שירותי OCR ותיקים והאם התמחור של 4 דולר ל-1,000 עמודים יוכיח את עצמו כתחרותי בקנה מידה ארגוני.