Mistral משיקה את OCR 4 עם bounding boxes וציוני confidence ב-170 שפות

חברת Mistral AI השיקה את OCR 4, מודל שמכוון לזרימות עבודה ארגוניות של עיבוד מסמכים ב-back-office ולא לצ'אט צרכני. המודל מפיק output מובנה — bounding boxes, סיווג בלוקים וציוני confidence מוטמעים — ב-170 שפות, מה שהופך אותו למתאים להזנת pipelines של RAG, agentic וחיפוש ארגוני, ולא רק לשפיכת טקסט גולמי. אפשר לארח אותו עצמאית בקונטיינר יחיד, והוא מתומחר ב-4 דולר לכל 1,000 עמודים בשימוש API — מיצוב זול ובר-deploy במכוון.
ציוני ה-confidence וה-bounding boxes הם הבידול: מערכות במורד הזרם יכולות להחליט באילו extractions לבטוח ומאיפה בעמוד הם הגיעו, וזה קריטי לשימושי back-office עתירי רגולציה (חשבוניות, חוזים, טפסים). אירוח עצמי בקונטיינר אחד נותן מענה לחששות data-residency ופרטיות שחוסמים OCR בענן בתעשיות מפוקחות.
אבל הסיפור האסטרטגי הוא ההפצה. OCR 4 מגיע לא רק דרך ה-API של Mistral אלא גם דרך Amazon SageMaker ו-Microsoft Foundry, ו-Microsoft אף ציינה בפומבי את ההשקה כאבן דרך בשותפות שלה עם Mistral — מה שממצב את המודל מול קונים ארגוניים שכבר נמצאים בענן של Microsoft. אסטרטגיית ה'הטמע-איפה-שהלקוח-כבר-נמצא' היא הדרך של Mistral להתרחב מעבר לצ'אטבוטים. לפי דיווחים החברה מנהלת מגעי גיוס בשווי של 20 מיליארד אירו תוך הרחבת קיבולת מרכזי הנתונים באירופה, וה-CEO ארתור מנש הגביר את ההשקה ב-X. מבחינה תחרותית, OCR הוא תחום צפוף (Google Document AI, AWS Textract, Azure Document Intelligence ומודלים פתוחים), ולכן הטריז הוא שילוב של מחיר, רוחב רב-לשוני, output מובנה עם confidence ואירוח עצמי. הסתייגויות: דיוק OCR בעולם האמיתי משתנה מאוד לפי איכות המסמך והשפה, וטענות 170 השפות וה-benchmark הן מטעם הספק. שווה לעקוב אחרי השוואות דיוק עצמאיות ואם הפצת SageMaker/Foundry באמת מייצרת ביקוש ארגוני.