מטא הכריזה אתמול (חמישי) על ארבעה דורות עוקבים של שבבי ה-Meta Training and Inference Accelerator שלה. שבבי ה-MTIA, פותחו בשיתוף פעולה עם חברת ברודקום ומתוכננים לפריסה במהלך השנתיים הקרובות, בקצב של כל חצי שנה.
מאיצי השבבים מבוססי ה-Chiplet תוכננו להריץ הסקת בינה מלאכותית (Inference) בצורה יעילה יותר מאשר מעבדים גרפיים (GPUs) המותאמים לעומסי עבודה של אימון מודלים.
ארבעת השבבים החדשים הם MTIA 300 ,MTIA 400 ,MTIA 450 ו-MTIA 500. ה-MTIA 300 כבר נמצא בייצור עבור אימון מערכות דירוג והמלצות, בעוד ה-400 נמצא כעת בבדיקות מעבדה לקראת פריסה במרכזי נתונים.
עוד באותו הנושא
700 מיליארד דולר: ענקיות הטק שופכות מאות מיליארדים על מרכזי נתונים
ה-MTIA 450 וה-500 מיועדים להסקת AI בתחילת 2027 ומתוכננים לפריסה המונית בהמשך אותה השנה. על פי הבלוג של מטא, מה-MTIA 300 ועד ל-MTIA 500, רוחב הפס של הזיכרון (HBM) גדל פי 4.5, וביצועי החישוב גדלים פי 25.
רוחב הפס של הזיכרון הם צוואר הבקבוק העיקרי בשלב הפענוח של הסקת מודלי טרנספורמר. ה-MTIA 500 מוסיף עוד 50% לרוחב הפס, לצד עלייה של עד 80% בקיבולת הזיכרון.
מטא טוענת כי ה-MTIA 450 מכפיל את רוחב הפס של הזיכרון לעומת ה-MTIA 400, ומתארת אותו כ"גבוה בהרבה מזה של מוצרים מסחריים מובילים קיימים", ומצביעה על היתרון מול אנבידיה.
הגישה של מטא כוללת גם האצת חומרה וחישובי רשת, בתוספת סוגי נתונים מותאמים בדיוק נמוך שתוכננו במיוחד עבור הסקה. ה-MTIA 450 מספק ביצועי MX4 גבוהים עם חישובים בדיוק נמוך מעורב שמונעים את התקורה של התוכנה בהמרת סוגי נתונים.
במונחים של פריסה עתידית, ה-MTIA 400, 450 ו-500 ישתמשו כולם באותה תשתית. המשמעות היא שכל דור שבבים חדש נכנס בדיוק לאותו שטח פיזי להחלפה קלה. מודולריות זו, אומרת מטא, "היא שעומדת מאחורי קצב השחרור של שבב בכל שישה חודשים – קצב מהיר בהרבה מהמחזור הטיפוסי בתעשייה של שנה עד שנתיים".
בשווי מיליארדי דולרים: מטא חתמה על עסקת שבבים עם AMD
ערכת התוכנה מאפשרת פריסת מודלים בייצור בו-זמנית על מעבדים גרפיים ועל MTIA מבלי להזדקק לכתיבה מחדש ספציפית לשבב. מטא ציינה כי כבר פרסה מאות אלפי שבבי MTIA באפליקציות שלה לצורך הסקה על תוכן אורגני ופרסומות.
כל זה מגיע שבועיים בלבד לאחר שמטא חשפה הסכם ארוך טווח לתשתית AI בשווי 100 מיליארד דולר עם AMD. הדבר מעיד על מאמץ להפחית את התלות באנבידיה בחלקים שונים של מערך ה-AI של מטא, תוך שמירה על MTIA בליבת עומסי העבודה של ההסקה.




