aiOla הישראלית השיקה מודל זיהוי דיבור המותאם לשימוש תעשייתי

הפלטפורמה כוללת מיקרופונים לבישים, אפליקציות שטח, ומנוע NLP תעשייתי • הדיבור מומר למידע שנכנס ישירות לתוך מערכות ניהול ארגוניות

צוות aiOla | קרדיט: aiOla

חברת הבינה המלאכותית הישראלית aiOla הכריזה על השקת Jargonic, מודל חדש לזיהוי דיבור (Speech-to-Text), שפותח על מנת לזהות מילים וביטויים בשפה מדוברת גם בתנאים שאינם סטריליים. המודל פועל ביותר מ-100 שפות ומתוכנן לטפל באתגרים של רעש רקע, איכות שמע נמוכה, מבטאים שונים ושימוש בז’רגון מקצועי או תעשייתי.

הפיתוח מבוסס על שיתוף פעולה בין חוקרי aiOla לבין מוסדות אקדמיים, כולל אוניברסיטת Carnegie Mellon. בצוות המחקר: פרופ’ יוסי קשת (המדען הראשי), ד"ר גיל חץ (סמנכ"ל מחקר ו-AI), ואסף אסבג (סמנכ"ל טכנולוגיה ומוצר). במסגרת הפיתוח נרשמו חמישה פטנטים, בהם Whisper-Medusa – טכנולוגיה המאפשרת זיהוי דיבור במהירות כפולה מהפתרונות הנפוצים.

Jargonic מציג תוצאות מדויקות בזיהוי מונחים מקצועיים מתוך מאגרי דאטה אקדמיים ואתגרים תעשייתיים. במאגר CommonVoice, למשל, נמדדה רמת דיוק של מעל 95% בזיהוי מונחים בגרמנית, ספרדית, צרפתית, אנגלית ופורטוגזית. שיעור הטעויות הממוצע (Word Error Rate) עמד על 5.91% בארבעה מאגרי נתונים אקדמיים באנגלית – נתון שמשפר את ביצועיהם של מודלים קיימים כמו OpenAI (6.52%), ElevenLabs (6.14%), Deepgram (6.48%) ו-Assembly AI (6.25%).

בנוסף, בבחינת זיהוי מונחי ז'רגון עסקיים מתוך מאגר Earnings – הנחשב למאתגר – הגיע המודל לדיוק של 89.3%, לעומת 85.1% (ElevenLabs), 82.9% (Assembly AI), 80.1% (Whisper) ו-77.5% (Deepgram). המודל אומן על יותר ממיליון שעות דיבור, כולל הקלטות מסביבות עבודה אמיתיות, ולא רק על מאגרי דאטה סטריליים.

המערכת משולבת בפלטפורמה של aiOla, הכוללת: מיקרופונים לבישים, אפליקציות ייעודיות לצוותי שטח, מנוע NLP מותאם לענפי תעשייה, וכלי אינטגרציה למערכות ניהול ארגוניות. הטכנולוגיה מתממשקת עם תהליכי עבודה קיימים ומאפשרת זיהוי שיח עסקי בזמן אמת, שליפת מילות מפתח והמרת הדיבור למידע תפעולי, אשר מתועד ומוזן ישירות למערכות הדיגיטליות של הארגון.

הפלטפורמה נועדה לצמצם הקלדות ידניות, להפחית שגיאות תיעוד ולשפר את מהירות הדיווח בשטח. בכך, הארגונים יכולים לבצע ניטור, תיעוד והפקת תובנות מתוך תקשורת קולית ללא צורך בהקלדה או עיבוד ידני.

החברה פועלת במתכונת B2B ומכוונת לארגונים בתחומי תעשייה, שירות, לוגיסטיקה, רפואה, ביטחון ועוד. המודל נבנה כדי לשפר את דיוק התיעוד והביצועים בסביבות עבודה מבוזרות ולא-סטריליות.

בינה מלאכותית הייטק ישראלי זיהוי דיבור