שנת 2025 הסתיימה עם מהלך מפתיע בעולם השבבים. אנבידיה הודיעה כי היא רוכשת את הקניין הרוחני וצוות המהנדסים של הסטארטאפ Groq (עם q בסוף, בשונה מ-Grok – הצ'אטבוט של חברת xAI של אילון מאסק).
סכום הרכישה לא פורסם, אך לפי דיווחים הוא עומד על קרוב ל20 מיליארד דולר. אנבידיה מתאפיינת בשליטה כמעט מוחלטת בשוק המעבדים הגרפיים והמעבדים ליישומי בינה מלאכותית, וגם ביכולת אסטרטגית לצפות את עתיד השוק.
הסיבות האלו הובילו לפרשנויות שונות של המהלך, כגון חסימה של רכישת החברה על ידי מתחרים והרחבת יכולות הפיתוח של החברה. עיתוי הרכישה הוסבר בכך שהוצאה כזו בסוף השנה יעילה מבחינת צמצום המיסוי לשנת 2025. ההסברים האלו כנראה נכונים, אך בבסיסו של המהלך טמון משהו עמוק וגדול הרבה יותר. הוא נועד לסייע לה להתמודד עם סכנה של ממש מצד מתחרה בלתי צפויה – גוגל.

שינוי מגמה בשוק: מאז שפרצה הבינה המלאכותית היוצרת לחיינו, הביקוש האינסופי לשבבים של אנבידיה נבע מהצורך לאמן מודלים. אימון מודל דורש הזנה של כמויות מידע עצומות אל תוך מנוע עיבוד, ואימון המודל על המידע הזה שוב ושוב עד שהתוצאות משביעות רצון. אבל לאחרונה קרה משהו חשוב – השוק עבר מאימון להסקה.
הסקה היא היכולת להשתמש במודל קיים על מנת ליצור תשובות למשתמשי המודל. כשאנחנו שולחים למודל בינה מלאכותית בקשה לנסח עבורנו מייל או ליצור תמונה, הוא משתמש שוב בשבבים של אנבידיה עליהם מאוחסן המודל, כדי ליצור עבורנו את התשובה המתאימה.
עבורנו כמשתמשים אין שינוי. הצורך שלנו היה תמיד במעבדים שיאפשרו למודל להשיב לבקשות שלנו. אבל עבור החברות שרוכשות את המעבדים מאנבידיה, הצורך הבוער ביותר הוא כבר לא אימון של עוד ועוד מודלים, אלא להחזיק די כוח עיבוד שיאפשר לכל הלקוחות של המודל להשתמש בו.
אנבידיה שלטה לחלוטין בשלב הראשון. מעבדי ה-GPU שלה היו הכלי המתאים ביותר לאימון המודלים. אבל בתפעול מודלים קיימים כדי ליצור תשובות, השבבים שלה בזבזניים ואיטיים יחסית, וככל שהמיקוד בשוק עובר ליכולת הסקה המעמד שלה מתחיל להיסדק.
בנקודה הזה המתחרה המסוכנת ביותר היא גוגל, משום ששבבי ה-TPU שלה הם בדיוק מה שנדרש עבור יכולת הסקה.

הסבר טכני: מעבדי ה-GPU של אנבידיה החלו את דרכם כמנועים גרפיים עבור משחקי מחשב ותוכנות עריכה. המבנה שלהם מתבסס על אלפי ליבות עיבוד שפועלות במקביל, זיכרון ראם מסוג HBM שמאחסן את המידע, ובקרי חומרה שמנהלים את חלוקת המשימות לליבות העיבוד ותעבורת המידע בין הראם למעבד.
היתרון הגדול של ה-GPU הוא עיבוד מקבילי. משימה אחת מחולקת לאלפי תהליכים שפועלים יחד ומקצרים את משך העיבוד. החיסרון הוא שתעבורת המידע הלוך ושוב אל זיכרון הראם והצורך לנהל את חלוקת העבודה גורמים לחוסר יעילות משמעותי שמתבטא בזמן תגובה ארוך, צריכת חשמל גבוהה ויצירת חום.
ה-GPU מצא את דרכו בשנים האחרונות אל מנועי הבינה המלאכותית וגם אל תעשיית הביטקוין.
מעבדי ה-TPU של גוגל
לעומת מעבדי אנבידיה שמצטיינים בעיבוד מקבילי, המעבדים של גוגל נוקטים גישה שונה לחלוטין. הם מתבססים על מערך סיסטולי. המשמעות היא שליבות העיבוד בנויות במערך והמידע זורם דרכן.
ההבדל הגדול באופן הפעולה בין הTPU לGPU, הוא שבמקום שכל ליבה תתפקד כמעבד עצמאי, המעבדים פועלים יחד כשכל ליבה מעבירה את תוצאת החישוב שלה למעבד הבא בתור בשורה. אופן הפעולה הזה חוסך את הגישה החוזרת ונשנית לזיכרון הראם שדורשת משאבים רבים.
החיסרון של המעבדים האלו הוא חוסר גמישות. בשונה מה-GPU של אנבידיה הם לא יכולים לבצע כל משימה. אבל היתרון הוא יעילות גבוהה מאוד בניצול משאבים וזמן תגובה נמוך במיוחד, גם כשמדובר במשימה קטנה יחסית כמו שאילתת חיפוש בגוגל או פרומפט שאנחנו שולחים לבינה מלאכותית.
מעבדי ה-TPU פותחו במקור עבור מנוע החיפוש של גוגל, (שמבוסס על בינה מלאכותית לכל דבר, גם אם לא ג׳נרטיבית כפי שאנו פוגשים אותה בשנים האחרונות). פריצת הבינה המלאכותית היוצרת לחיינו העניקה לו שימוש חדש – תפעול מערך השרתים של גוגל ג'מיני.

מעבדי ה-LPU של Groq
החידוש הגדול של גרוק הוא בארכיטקטורה, ומטרתה המוצהרת היא להקטין את עלויות וזמן התגובה של מודלי בינה מלאכותית. ההישג הזה מתבסס על הוצאה של 2 אלמנטים מהמשוואה – החומרה שאחראית על חלוקת העבודה בין המעבדים, ושימוש ברכיבי זיכרון קטנים ופשוטים מסוג SRAM שמחוברים ישירות למעבד, במקום בזיכרון ראם גדול חיצוני.
חלוקת העבודה בין המעבדים מתבצעת על ידי מהדר התוכנה עצמו, שחוסך את הצורך בניהול תהליך העיבוד על ידי חומרה ייעודית ומשפר מאוד את היעילות.
באופן מסורתי המהדר היה אחראי רק לתרגום שפת התכנות לשפת מכונה, אבל גרוק הוסיפו לו את תפקיד התכנון המדויק של תהליך העיבוד, מה שמקצר מאוד את התהליך ושומר על תיאום מושלם בין כל הליבות.
מאימון להסקה – האיום על אנבידיה
המעבר מעידן אימון המודלים שדרש עיבוד מקבילי חזק ככל האפשר לעידן ההסקה בו נדרשת יעילות גבוהה ומינימום עלויות לטוקן, מהווה איום של ממש על המודל הכלכלי של אנבידיה.
אנבידיה אלופה בתכנון וייצור של מפלצות חישוב גמישות וכל יכולות, אבל אין לה מענה מסחרי שיתחרה ביעילות ההסקה של ה-TPU, והיא מבינה שעליה לפתור את הבעיה בטרם יהיה מאוחר מדי.
המעבר לעידן ההסקה מתאפיין בצמצום משמעותי של היקף ההשקעות שזורמות לתחום, והחברות נדרשות עכשיו להתייעל ולהפוך לרווחיות מהר ככל האפשר. הדרך לשם היא בראש ובראשונה לצמצם עלויות.

רכישת גרוק – מהלך אסטרטגי
מהלך הרכישה של גרוק נועד למטרה אחת – להבטיח שאנבידיה תיוותר רלוונטית ותמשיך לשלוט בשוק גם בעידן ההסקה.
שילוב של הטכנולוגיות שגרוק פיתחה במוצריה של אנבידיה, יאפשר לה להציע עלות נמוכה לטוקן וכך היא תשמור על דומיננטיות בשוק גם כשאימון המודלים יהפוך לחשוב הרבה פחות.
הצעד הזה כבר קרה, כשבתערוכת CES בלאס וגאס ג'נסן הואנג מנכ"ל החברה הציג את ורה רובין – מעבד הבינה המלאכותית החדש של אנבידיה שכבר מתבסס על הטכנולוגיות שנרכשו מגרוק.
מי עוד מתחרות?
הצורך הזה הופך לחשוב אפילו יותר כשלוקחים בחשבון את המתחרות שצומחות בשוק הזה בינתיים.
אמזון פיתחה שבבים בשם Trainium ו Inferentia עבור שירותי הענן שלה, שמציעים עלויות הסקה לטוקן נמוכות בערך ב-40% בהשוואה ל-GPU. מיקרוסופט בונה את Maia 100 שנועד להריץ את ChatGPT ואת Copilot באופן עצמאי וללא תלות באנבידיה.
גם מטא עובדת על שבבים משלה שייקראו MTIA, וגם הם מיועדים לספק יכולת הסקה בעלויות נמוכות ככל האפשר.

השורה התחתונה
הרכישה של גרוק על ידי אנבידיה לא נועדה רק לחסום מתחרים או לשפר את ליין המוצרים שלה, אלא היא מהלך הכרחי שבלעדיו אנבידיה הייתה בסכנה של ממש לאבד את הבכורה בשוק הבינה המלאכותית לטווח הארוך.
בחינת הנושא מהפרספקטיבה הזו הופכת את סכום הרכישה להגיוני הרבה יותר. עבור אנבידיה כל כך הרבה מונח על כף המאזניים, שקרוב לוודאי שההשקעה הזו תחזיר את עצמה במהירות.
במבט לעתיד הקרוב כנראה ששיאי ההכנסות של אנבידיה יתמתנו ואולי אף ייסוגו ככל שהמתחרות שלה בשוק יהפכו לדומיננטיות יותר. אבל אנבידיה שמצטיינת כל כך בראיית הנולד כבר סימנה את היעדים הבאים ואף הציגה אותם ב-CES – מעבדים עבור רובוטים דמויי אדם ועבור רכבים אוטונומיים.
אם לשפוט לפי העבר, אנבידיה שוב תבנה מונופול ותרוויח ממנו היטב בתחום שנראה עדיין לוט בערפל, וכשמתחרותיה ינסו להדביק את הפער היא כבר תצבור תאוצה בדרך ליעד הבא.
הכותב הוא שלמה שטראוס, מנהל מערכות מידע בערוץ 10.





