Liquid AI משחררת מודלי retrieval LFM2.5 לחיפוש רב-לשוני מהיר
Liquid AI שחררה שני מודלי retrieval חדשים ב-Hugging Face: LFM2.5-ColBERT-350M, מודל late-interaction, ו-LFM2.5-Embedding-350M, מודל dense bi-encoder. שניהם נושאים 350M פרמטרים ותוכננו לחיפוש מהיר רב-לשוני וחוצה-שפות על פני 11 שפות, עם טביעת רגל קטנה שמתאימה למגוון תרחישי deploy — מ-edge ועד server. אלה החברים הראשונים הדו-כיווניים במשפחת LFM, בהמשך ל-LFM2.5-350M-Base הקודם, והם מגיעים תחת LFM Open License v1.0.
השילוב של dense bi-encoder ומודל late-interaction בסגנון ColBERT הוא הצעה מכוונת של שני פרדיגמות retrieval: bi-encoders מהירים וזולים ל-retrieval בשלב הראשון, בעוד מודלי late-interaction כמו ColBERT מוותרים על מעט יעילות בתמורה לדיוק גבוה יותר באמצעות שימור אינטראקציות ברמת ה-token. ב-350M פרמטרים בלבד, שניהם מכוונים לצוותים שרוצים retrieval רב-לשוני חזק בלי העלות של מודלי embedding גדולים.
השחרור נוחת בעיצומו של שבוע תוסס למודלים פתוחים ב-Hugging Face: Gemma 4 12B הפך למודל המורד ביותר בפלטפורמה עם יותר מ-4 מיליון הורדות בשבוע הראשון, GLM 5.2 יצר באז (קלמנט דלאנג מ-Hugging Face הגביר טענה שמדובר במודל 'מוביל אמיתי' שרץ מקומית מול Claude Opus), ו-Transformers v5.12.0 הוסיף את MiniMax-M3-VL בן 428B פרמטרים. נישת מודלי ה-retrieval תחרותית, עם שחקנים ותיקים חזקים מ-Cohere, BAAI (BGE) ו-Nomic.
עבור מפתחים שבונים מערכות RAG, retrievers רב-לשוניים קטנים ויעילים בעלי ערך דווקא כשהתעשייה דוחפת לאפליקציות אגנטיות מבוססות retrieval (ראו את AgentCore web search ואת מאגרי הידע המנוהלים של AWS השבוע). הרישיון הפתוח והגודל הקטן מורידים את החסם לפריסות self-hosted רגישות-פרטיות. שווה לעקוב אחר השוואות benchmark עצמאיות מול BGE-M3 וה-embeddings הרב-לשוניים של Cohere כדי להעריך איכות בעולם האמיתי.