חברת DeepSeek, מעבדת הבינה המלאכותית הסינית, מעוררת סערה נוספת בשוק הטכנולוגיה עם השקת מודלים חדשים ומתקדמים ליצירת תמונות, ביניהם Janus-Pro 7B, המוצגים כמתחרים משמעותיים ל-DALL-E 3 של OpenAI. המודל החדש, שזמין להורדה דרך פלטפורמת הפיתוח Hugging Face, מציע יכולות יוצאות דופן בתחום ניתוח ויצירת תמונות. תחת רישיון MIT הפתוח, המודל מתאים לשימושים מסחריים ואקדמיים כאחד, עובדה שמרחיבה את פוטנציאל השימוש שלו.
DeepSeek, הממומנת על ידי חברת ההשקעות High-Flyer Capital Management, מתמקדת בפיתוח מודלים פתוחים ומתוחכמים. מודל Janus-Pro 7B, חלק מסדרה חדשה בשם Janus-Pro, מתואר כשלב טכנולוגי פורץ דרך. המודל בנוי על תשתית אוטורגרסיבית, המשלבת הבנה ויצירה מולטימודלית של טקסט ותמונות. אחת התכונות הבולטות של המודל היא פיצול תהליך קידוד הוויזואלי לערוצים נפרדים, המשפר את ביצועיו.
במבחני GenEval ו-DPG-Bench, המודל השיג תוצאות מרשימות שעקפו את אלה של DALL-E 3 המוביל ומודלים ותיקים נוספים כמו Stable Diffusion XL. אף שמגבלות מסוימות, כמו יכולת לנתח תמונות ברזולוציה של עד 384×384 בלבד, עשויות להטיל ספק קל בהישגיו, גודלו הקטן ביחס למודלים מתחרים הופך אותו לחדשני ויעיל במיוחד.
עוד באותו הנושא
בשבוע שעבר שוחרר המודל הקודם, DeepSeek-R1, המתמקד בכישורי הסקת מסקנות. מנכ"ל Perplexity, פלטפורמת AI, הכריז כי מדובר ב"מודל ההסקה החזק בעולם". DeepSeek הוקמה בשנת 2023 על בסיס יחידת מחקר בינה מלאכותית של קרן גידור, במטרה להגיע לאינטליגנציה כללית מלאכותית (AGI). הצלחתה של DeepSeek, שגרמה לירידות חדות בשווקים בימים האחרונים, בעולם שבו השקעות עתק בתחום ה-AI הופכות לנורמה, מעוררת דיון בשאלה אם שווי החברות בשוק מבוסס על פיתוחים אמיתיים או שמדובר בבועה כלכלית שממתינה להתפוצץ.
המהפכה שמובילה DeepSeek מעוררת עניין גם בקרב מתחרותיה הגדולות. מנכ"ל OpenAI, סם אלטמן, התייחס למודלים החדשים ושיבח את הישגיהם, אך הדגיש כי "המירוץ ידרבן פיתוח של מודלים טובים עוד יותר". במקביל, הצהרות DeepSeek על פיתוח המודלים בעלויות נמוכות מבעבר, עוררו שאלות בתעשייה על משאבי הפיתוח הנדרשים באמת.
בתוך כך, חברת הבינה המלאכותית הסינית הודיעה כי היא מתמודדת עם מתקפת סייבר רחבת היקף שפגעה בשירותיה. החברה נאלצה להגביל את רישומי המשתמשים החדשים בעקבות המתקפה, אך הבטיחה כי המשתמשים הקיימים ימשיכו ליהנות מגישה רגילה.
לפי הצהרת החברה, מדובר במתקפה שמטרתה הייתה לשבש את פעילות הפלטפורמות שלה ולפגוע במוניטין שנבנה בתקופה האחרונה. "אנו מזהים ניסיונות מתמשכים לנצל חולשות ולחדור למערכותינו", אמר דובר מטעם החברה. "אנחנו פועלים במהירות לשדרג את האבטחה ולשקם את השירותים המלאים".
בעוד החברה טרם פירסמה את היקף הנזק שנגרם כתוצאה מהפריצה, מומחים מזהירים מפני סיכון אפשרי לזליגת נתונים, במיוחד בשל העובדה שמודליה של DeepSeek מתמקדים בניתוחי נתונים רחבי היקף. אם אכן מדובר בניסיון לגניבת קוד או נתונים, הפגיעה עלולה להיות משמעותית הן למשתמשים והן לחברה.