חברת Impala AI גייסה 11 מיליון דולר להרצת מודלי שפה גדולים

הפלטפורמה של החברה נועדה לאפשר לארגונים להריץ AI בהיקף בלתי מוגבל, תוך הורדה דרמטית של העלויות ושמירה על גמישות ושליטה
מייסדי Impala ai. מימין: בועז טויטו CTO ונועם זלינגר מנכ"ל. צילום: עומר הכהן

מייסדי Impala ai. מימין: בועז טויטו CTO ונועם זלינגר מנכ"ל. צילום: עומר הכהן

הסטארטאפ Impala AI הודיע על גיוס סיד של 11 מיליון דולר, בהובלת הקרנות Viola Ventures ו-NFX. החברה פיתחה שכבת תשתית חדשה להרצת מודלי שפה גדולים (LLM inference), שנועדה לאפשר לארגונים להריץ AI בהיקף בלתי מוגבל. תוך הורדה דרמטית של העלויות ושמירה על גמישות ושליטה. ההשקעה תשמש להרחבת הצוות, העמקת יכולות המוצר והאצת הפריסה בשוק.

הפלטפורמה מספקת חוויית serverless, תוך שהיא מטפלת באתגרי ניהול כושר ה-GPU, מבלי להתפשר על שליטה ארגונית. אימפלה מספקת עד פי 13 חיסכון בעלות לכל טוקן בהשוואה לפלטפורמות inference זמינות כיום, תוך שמירה על רמת גמישות ואמינות ארגונית. הפלטפורמה מנוהלת באופן מלא, מולטי-קלאוד ורב-אזורית, שנפרסת ישירות ב-VPC של הלקוח, ומאפשרת שליטה מלאה בנתונים, בעלויות ובבחירת הענן.

הביקוש לתשתיות AI שעולה בקצב מהיר על ההיצע מביא לכך שארגונים מתמודדים עם אתגרים גוברים בהרצת עומסי עבודה של inference בקנה מידה גדול בצורה יעילה. התעשייה מפנה את תשומת הלב שלה יותר ויותר מהאימון (training) להרצה (inference), שנעשית לאתגר המרכזי מבחינת עלות ותפעול ב-AI ארגוני.

לפי ניתוח שוק עדכני, שוק ה-inference צפוי להגיע ל-106 מיליארד דולר עד 2025 ולצמוח ל-255 מיליארד דולר עד 2030. חברת המחקר Canalys ציינה לאחרונה כי בניגוד לאימון, שהוא השקעה חד-פעמית, inference מייצג עלות תפעול חוזרת, דבר שהופך אותו למגבלה קריטית בדרך למסחור ה-AI.

Impala מנצלת את הביקוש ההולך וגובר ל-GPU על ידי פתיחת יכולות ניצול שמעבר לסטנדרט המקובל כיום ומביאה לשבירת צווארי הבקבוק של ההיצע. בעולם שבו מודלים בקוד פתוח הופכים לסטנדרט דה-פקטו בשימוש הארגוני, Impala מספקת את השכבה החסרה של הרצת inference במקום שבו הנתונים נמצאים, עם השליטה והיעילות שארגונים גלובליים דורשים, ללא פשרות באמינות ובגמישות וכל זאת באמצעות מנוע הרצה ייחודי.

Impala AI הוקמה בשנת 2025 על ידי נועם זלינגר, מנכ"ל, לשעבר מנהל בכיר ב-Granulate ובועז טויטו בוגר 8200, סמנכ"ל טכנולוגיות. החברה כבר עובדת עם חברות Fortune 500 ומתכננת להתרחב גלובלית עם סבב הגיוס הנוכחי.

נועם זלינגר: “אנחנו בפתחו של עידן חדש ב-AI, שבו ה-inference יהפוך למנוע הדומיננטי בגל החדש של חדשנות. ב-Impala אנחנו לא בונים עוד פלטפורמה, אלא את התשתית שתפעיל את ה-AI בקנה מידה אמיתי. המשימה שלנו היא לאפשר לכל צוות בחברה למצות את מלוא הפוטנציאל של המודלים שלו באופן חכם, יעיל וחסכוני יותר מאי פעם ולהפוך את ה-inference לבלתי-נראה.

"כאשר צוות מחבר את Impala לענן שלו, הוא לא צריך לחשוב על הקצאות, סקיילינג או אופטימיזציה של  GPU. אנחנו מטפלים בכל זה מאחורי הקלעים, כך שהם יכולים להתמקד לחלוטין בבניית מוצרי AI. לשם כך גייסנו את המוחות המבריקים ביותר ממספר תחומים שונים, כדי להוות נדבך מרכזי בגל החדש של חדשנות AI".

בינה מלאכותית | צילום: Anggalih Prasetya, שאטרסטוק
בינה מלאכותית | צילום: Anggalih Prasetya, שאטרסטוק

אלכס שמולוביץ, שותף ב-Viola Ventures: “הביקוש ל-AI מואץ ועובר מפיילוטים אל לב הפעילות הארגונית, אולם האימוץ של כלי AI בארגונים מועט משמעותית על ידי העלות והמורכבות. כשם שמסדי נתונים הפכו לכלי ליבה בארגונים, כך גם מודלי שפה הופכים להיות מרכזיים בקבלת החלטות ואוטומציה.

"מרבית פלטפורמות ה-inference נתקעות באותם חסמים של עלויות תשתית עולות, טיפול בעייתי בנתונים ואינטגרציות שבירות. הפלטפורמה של Impala הופכת את האימוץ בקנה מידה גדול לפשוט, חוסכת עלויות, מגנה על נתונים רגישים ומסירה חסמים,  תוך שהיא מעניקה לארגונים גמישות ופשטות. בזכות המומחיות העמוקה של נועם וצוותו, Impala ממוצבת בצורה ייחודית לקבוע סטנדרט חדש לתשתיות AI ארגוני ולאפשר לארגונים לממש את מלוא הפוטנציאל".

שרי ברונפלד, שותפה ב-NFX: “הקרב האמיתי על אימוץ ה-AI יתרחש בשלב ההרצה. ארגונים לא צריכים רק מודלים גדולים יותר, אלא דרכים יעילות, ניתנות להרחבה וחסכוניות להביא את המודלים האלה לפרודקשן. Impala פותרת את הבעיה הזו ישירות, עם טכנולוגיה אלגנטית ומוכנה לארגונים. אנחנו נרגשים לתמוך בצוות הזה בזמן שהוא בונה את עמוד השדרה של כלכלת ה-inference".

שתפו כתבה זו:

כותרות הכלכלה

guest
1 תגובה
משוב מוטבע
הצג את כל התגובות
דב שמואל
דב שמואל
4 חודשים לפני

מרשים מאוד.

עקבו אחרינו ברשתות החברתיות

עוד כתבות מעניינות

טען עוד כתבות