Google2026-04-14

Gemini 2.5 Flash שוחרר כמודל reasoning עם latency נמוך ל-APIs למפתחים

ניתוח AI

Google DeepMind חשפה את Gemini 2.5 Flash, מודל ניסיונות ב-Google AI Studio וב-Gemini API המיועד למהירות ויעילות עלויות תוך שמירה על יכולת חשיבה. המודל תומך בחלון הקשר של 1M token ומוצב כמקבילה חסכונית ל-Gemini 2.5 Pro. מפתחים ציינו time-to-first-token מהיר משמעותית לעומת Pro, מה שהופך אותו מתאים ליישומים אינטראקטיביים ו-agentic.