הונג קונג משיקה את HKGAI-V3 מבוסס DeepSeek, ממוטב לשבבים מקומיים

מרכז המחקר והפיתוח ל-Generative AI של הונג קונג (HKGAI) השיק את HKGAI-V3, LLM חדש הבנוי על DeepSeek V4 ומותאם ספציפית לרוץ על שבבים מקומיים במקום על חומרה של NVIDIA. טענות היעילות הראשיות מרשימות: דחיסת token של יותר מפי עשרה ועלייה של כמעט פי מאה בזמן ריצה רצוף של agent, כאשר פלטפורמת agent מבוססת HKGAI-V3 פעלה לכאורה ביציבות עד 28 שעות ברציפות.
ההתאמה לשבבים מקומיים היא הליבה האסטרטגית. בעידן של export controls אמריקאיים שמגבילים גישה למאיצי NVIDIA מתקדמים, בניית מודלים ברמת frontier שרצים ביעילות על סיליקון מתוצרת סין היא מהלך של ריבונות וחוסן. נתוני דחיסת ה-token וזמן הריצה הארוך, אם יאומתו, יתמודדו עם שניים מהחסמים המעשיים ביותר ל-deployment של agents בקנה מידה — עלות (פחות tokens) ואמינות לאורך משימות ארוכות-טווח (28 שעות ריצה רצופה).
DeepSeek עצמה מתקרבת לכאורה לעסקה לגיוס 7.4 מיליארד דולר עבור מאמצי ה-AI ה-open-source שלה, מה שמדגיש את המומנטום המסחרי מאחורי שושלת DeepSeek שעליה HKGAI-V3 נבנית. DeepSeek נותרת נקודת ייחוס למודלי frontier פתוחים וחסכוניים, והיא אחת מהאופציות הנקובות בתוך Azure AI Foundry של Microsoft.
טענות היעילות מצדיקות ספקנות עד שיעברו benchmark עצמאי — דחיסה פי עשרה ושיפור ריצה פי מאה הם נתונים יוצאי דופן שדורשים בחינה לגבי אילו משימות ובאיזה מחיר איכותי. עם זאת, האות הרחב יותר אמיתי: מעבדות סיניות והונג-קונגיות רודפות באגרסיביות אחרי stack ה-AI על חומרה מקומית. קהילת DeepSeek נותרת נלהבת, ו-thread ב-r/DeepSeek על לחצים גאופוליטיים מושך מעורבות לוהטת. שווה לעקוב אחרי אימות צד-שלישי לטענות הריצה והדחיסה.