זול עם ביצועים טובים: החברה הסינית שמערערת על הדומיננטיות האמריקאית בבינה המלאכותית

DeepSeek, סטארט-אפ בינה מלאכותית סיני, מזעזע את התעשייה העולמית עם מודלים מתקדמים שמאתגרים את חברות הענק האמריקאיות • האם OpenAI צריכה להתחיל לדאוג?

בינה מלאכותית | תמונה: שאטרסטוק

סטארט-אפ הבינה המלאכותית הסיני DeepSeek מעורר סערה בעולם הטכנולוגיה בארה"ב בזכות הגישה הפתוחה שלו והדגמים הזולים שהוא מפתח. החברה, שממוקמת בהאנגג'ואו, הצליחה ליצור מודלים מתקדמים שמתחרים באלה של ענקיות טכנולוגיה אמריקאיות, תוך כדי התמודדות עם ההגבלות הקשות של ארה"ב על יצוא שבבים לסין.

DeepSeek זכתה לכותרות מרכזיות במדיה העולמית בעקבות שחרור מודל השפה הגדול DeepSeek-R1 ב-20 בינואר, שדווח כי ביצועיו בתחומים כמו כימיה, מתמטיקה וקידוד משתווים לאלה של המודל המתקדם OpenAI’s o1.

המודל של DeepSeek עורר עניין רב בקרב מדענים, והצלחת החברה מגבירה את הלחץ על הדומיננטיות האמריקאית בתחום הבינה המלאכותית. DeepSeek הצליחה להשיג ביצועים דומים לאלה של החברות האמריקאיות, בעלויות נמוכות בהרבה וללא השימוש בשבבים מתקדמים שמוגבלים לייצוא לסין. מאז שחרור המודל DeepSeek-V3 בדצמבר, החברה הפכה לנושא שיחה מרכזי בפורומים ובמדיה החברתית. DeepSeek הוקמה על ידי מנהל קרן גידור, ליאנג וונפנג, שבאמצעות משאבים מוגבלים יחסית הצליח לבנות מודל עם 671 מיליארד פרמטרים בעלות של 5.6 מיליון דולר בלבד, בעוד שעלות פיתוח דגמים דומים על ידי חברות אמריקאיות מגיעה לעשרות מיליוני דולרים.

מומחים רואים בגישת הקוד הפתוח של החברה לא רק איום טכנולוגי אלא גם חידוש שעשוי לשנות את כללי המשחק בתעשיית הבינה המלאכותית. גישה זו מעודדת שיתוף פעולה גלובלי ופיתוח טכנולוגי משותף. DeepSeek אינה מגייסת השקעות חיצוניות ומממנת את פעילותה דרך ההכנסות מקרן הגידור High-Flyer, שמנוהלת על ידי ליאנג. המשרד שלה מתפקד כמו קמפוס מחקרי, ובו מועסקים חוקרים בולטים מאוניברסיטאות מובילות בסין. ליאנג, שנחשב לדמות חידתית, זוכה להערכה רבה בשל הישגי החברה. הוא עצמו השתתף לאחרונה במפגש יזמים עם מנהיגים בכירים בסין, בהם נקרא להוביל פריצות דרך טכנולוגיות.

חברת DeepSeek הצליחה להוזיל משמעותית את עלויות הפיתוח של מודל ה-AI שלה בזכות שימוש בשבבים פחות יקרים וניצול מיטבי של המשאבים הקיימים. במקום להסתמך על שבבים מתקדמים ויקרים, החברה התמחתה באופטימיזציה של שבבים סטנדרטיים כמו Nvidia H800, הכוללות אלגוריתמים מתוחכמים לניהול עומסים ותיאום בין שבבים, דבר שאיפשר לה להוציא לפועל פרויקטים שאפתניים בעלות נמוכה יחסית. גישה זו, שפותחה בעקבות מגבלות היצוא שהטילה ארה"ב על שבבים מתקדמים, לא רק חסכה בעלויות אלא גם שינתה את כללי המשחק בתחום, כאשר DeepSeek השיגה תוצאות שמתחרות בחברות הגדולות בעולם בעלות מזערית יחסית.

ההשפעה של DeepSeek מורגשת גם בארה"ב, שם חברות ענק כמו Meta ו-OpenAI מתמודדות עם לחצים גוברים להתחרות במודלים המתקדמים של החברה הסינית. דיווחים מצביעים על כך שמהנדסים בחברות אמריקאיות מנסים לנתח את הטכנולוגיה של DeepSeek כדי לחקות אותה. במקביל, ארה"ב משקיעה מאות מיליארדי דולרים בתשתיות בינה מלאכותית, בניסיון לשמר את יתרונה הטכנולוגי.

למרות ההצלחות, האתגר הגדול ביותר של DeepSeek הוא העתיד. בעוד שהיא מצליחה לנצל שבבים מוגבלים בצורה מיטבית, השאלה היא האם תוכל להמשיך להתחרות עם ענקיות טכנולוגיה אמריקאיות שמחזיקות משאבים כמעט בלתי מוגבלים.

OpenAI בינה מלאכותית מטא