OpenAI GPT OSS ומודלי Nemotron של NVIDIA נוחתים על Bedrock ב-AWS GovCloud

Amazon Bedrock מציעה כעת את המודלים הפתוחים GPT OSS של OpenAI (120B ו-20B פרמטרים) ואת משפחת Nemotron של NVIDIA (Nano 9B v2, Nano 12B v2, Nano 30B ו-Super 120B) בתוך AWS GovCloud (US). ההשקה מביאה מודלים פתוחים מובילים ממקור אמריקאי לסביבות עם דרישות data-residency מחמירות, ומכוונת לסוכנויות ממשלתיות ולתעשיות תחת רגולציה שאינן יכולות להשתמש באזורי ענן מסחריים.
הזמינות ב-GovCloud חשובה כי היא פותחת פלח — לקוחות פדרליים, ביטחוניים ותשתיות קריטיות — שדורש תשתית מבודדת פיזית ולוגית עם בקרות תפעוליות של אזרחי ארה"ב. הצעת מודלים פתוחים שם משמעה שהלקוחות האלה יכולים להריץ inference על תשתית עם data-residency הניתנת לביקורת, בלי לשלוח נתונים רגישים לאזורים מסחריים סטנדרטיים או להסתמך רק על מודלים סגורים מבוססי API.
המהלך משתלב בתמה רחבה יותר של ריבונות השבוע: Palantir השיקה בנפרד מנוע לפריסת המודלים הפתוחים Nemotron של NVIDIA בסביבות מסווגות ומנותקות-רשת (air-gapped) עם הרשאת נתונים מפורשת, אכיפת פרימטר מאובטח, וביקורת מלאה. מודלים פתוחים הפכו למצע המועדף לפריסות ריבוניות ולביטחון לאומי בדיוק כי אפשר לבחון אותם, לעשות להם fine-tune, ולהריץ אותם כולם בתוך השליטה של הלקוח.
מבחינה תחרותית, זה ממצב את AWS GovCloud מול Azure Government ומול ההצעות הריבוניות של Google, כשזווית המודלים הפתוחים היא הבידול מול APIs סגורים מובילים. GPT OSS נותן ל-OpenAI דריסת רגל בעומסי data-residency שהיא לא יכולה לשרת דרך ה-API המתארח שלה, בעוד Nemotron של NVIDIA ממשיך את ההתרחבות שלו במודלים פתוחים לארגונים. שווה לעקוב אילו סוכנויות יאמצו ראשונות והאם ביצועי GPT OSS בסביבות מוגבלות ישתוו לאחיו המסחריים.