מיקרוסופט הכריזה הערב על Maia 200 – שבב ייעודי להפעלת מודלי AI בזמן אמת. השבב מספק ביצועי FP4 הגבוהים פי שלושה מאלה של הדור השלישי של Amazon Trainium, וביצועי FP8 העולים על אלו של ה-TPU מהדור השביעי של גוגל.
Maia 200 פותח בתהליך ייצור של 3 ננומטר ב-TSMC, כולל ליבות Tensor ייעודיות ל-FP8 ו-FP4, מערכת זיכרון שעוצבה מחדש עם 216GB של HBM3e בקצב של 7 טרה-בייט לשנייה, וכן 272MB של SRAM. על גבי השבב מנועי העברת נתונים שמבטיחים שמודלים עצומים יפעלו במהירות, ביעילות ובניצול גבוה.

מה יש מתחת למכסה: 3 נ״מ, HBM3e וליבות Tensor ל-FP4/FP8
Maia 200 נפרס כבר היום באזור הדאטה סנטרים של US Central, ובהמשך יגיע גם לאזורים אחרים. במקביל משיקה החברה תצוגה מוקדמת של Maia SDK, שנועדה לסייע למפתחים לבצע אופטימיזציה ל-Maia 200. ה-SDK כולל תוכנה אינטגרטיבית ומודל תכנות מרחבי, המאפשרים למשתמשים מתקדמים שליטה מדויקת ברמה החומרה – תוך שמירה על קוד נייד המתאים לסביבות הכוללות מגוון מאיצים הטרוגניים.
עוד באותו הנושא
השבב מיוצר בתהליך 3 ננומטר המתקדם של TSMC, כולל למעלה מ-100 מיליארד טרנזיסטורים, ומותאם לעומסי עבודה של בינה מלאכותית בקנה מידה רחב – תוך שמירה על יעילות גבוהה בעלות.
המאיץ תוכנן לביצועים גבוהים במיוחד בחישוב בדיוק נמוך: כל שבב של Maia 200 משפה למעלה מ-10 פטה-פלופס בדיוק של 4 ביט (FP4), וכ-5 פטה פלופס בדיוק של 8 ביט (FP8) – והכל במסגרת מעטפת הספק של 880 ואט (TDP). המשמעות: Maia 200 מסוגל להריץ בקלות את המודלים הגדולים ביותר הקיימים כיום, עם מרווח משמעותי גם למודלים גדולים אף יותר בעתיד.

תת מערכת הזיכרון של Maia 200 מבוססת על טיפוסי נתונים בדיוק נמוך, מנוע DMA ייעודי, זיכרון SRAM על גבי השבב ורשת תקשורת פנימית (NoC) ייעודית להעברת נתונים בקצבים גבוהים.
כל מאיץ מספק 4 טרה-בייט לשנייה של רוחב פס ייעודי ל-Scale Up (28 חיבורי 400Gbe) ויכולת לספק ביצועים עקביים וצפויים גם בהפעלה מתואמת של אלפי מאיצים – עד 6,144 יחידות באשכול אחד.
הארכיטקטורה מאפשרת להפעיל קבוצות גדולות של מאיצי AI שפועלים יחד בקנה מידה רחב, בצורה יעילה מבחינה אנרגטית ובעלות כוללת נמוכה יותר בכל צי הדאטה סנטרים של Azure.
איפה זה פוגש את המוצר: Azure היום, Copilot ולקוחות בהמשך
הראשונים לעשות שימוש ב-Maia 200 יהיו צוות Microsoft Intelligence, שיפעילו את המאיץ לצורך יצירת דאטה סינתטי ולמידה וזאת כחלק מהפיתוח של הדור הבא של מודלי ה-AI הפנימיים של מיקרוסופט.
המשמעות היא האצה משמעותית של תהליכי יצירה, סינון ועיבוד של דאטה איכותי וממוקד תחום, כמו טקסטים, הוראות וקוד, שמזין את שלבי האימון של המודלים באותות עדכניים, מדויקים ורלוונטיים יותר.
בעתיד Maia 200 ישולב גם בהפעלת עומסי AI של Microsoft Foundry ושל Microsoft 365 Copilot, כחלק מתשתית ה-AI ההיברידית והרחבה של מיקרוסופט בענן הגלובלי. בהמשך צפויה גם פתיחה הדרגתית של היכולת הזו ללקוחות.
ו….?