חברת DeepMind מבית גוגל חשפה את Gemini Robotics On-Device – מודל שפה חדש המאפשר לרובוטים לפעול עצמאית ולבצע משימות מורכבות, גם ללא חיבור לאינטרנט. מדובר בשדרוג משמעותי ליכולות הרובוטיות של גוגל, המרחיב את הדגם הקודם שהושק בענן בחודש מרץ.
המודל החדש רץ ישירות על חומרת הרובוט עצמו, ומייתר את הצורך בגישה לשרתים מרוחקים או לעיבוד נתונים בענן. הוא מסוגל לתרגם הוראות בשפה טבעית לפעולות פיזיות מדויקות, ומספק למפתחים שליטה מקומית מלאה – יתרון משמעותי מבחינת אבטחת מידע, זמינות ומהירות תגובה.
לדברי גוגל, הביצועים של Gemini On-Device קרובים לאלו של גרסת הענן, ואף עולים על מודלים מקומיים אחרים לפי מבחנים פנימיים שבוצעו – אם כי החברה לא ציינה אילו מודלים נבדקו.
עוד באותו הנושא
במהלך הדגמה חיה, נראו רובוטים מבצעים מגוון פעולות יומיומיות כמו פתיחת תיקים, קיפול בגדים והרכבת פריטים. המודל פותח במקור עבור רובוטים מסדרת ALOHA, אך לאחר מכן הותאם גם לרובוט Franka FR3 בעל שתי זרועות תעשייתיות ולרובוט ההומנואידי Apollo של חברת Apptronik מטקסס.
לטענת החברה, הרובוט Franka הצליח להתמודד בהצלחה עם משימות שהוא לא תורגל בהן מראש – דוגמת הרכבה על פס ייצור תעשייתי – וזאת בזכות גמישות המודל ויכולתו הכללית להבין הוראות מופשטות.
במקביל, גוגל משיקה גם ערכת פיתוח חדשה (Gemini Robotics SDK), המאפשרת למפתחים ללמד רובוטים משימות חדשות באמצעות 50 עד 100 הדגמות וירטואליות בלבד, באמצעות סימולציות בפלטפורמת MuJoCo – סימולטור פיזיקלי שגוגל רכשה בשנת 2021.
המהלך מגיע על רקע תחרות מתעצמת בתחום רובוטיקת הבינה המלאכותית. בין השחקנים המרכזיים: חברת Nvidia שמפתחת תשתית למודלי בסיס להומנואידים, חברת Hugging Face שעובדת על מודלים ודאטה פתוחים לרובוטיקה – וגם בונה רובוטים עצמה – והסטארט-אפ הדרום-קוריאני RLWRLD, הנתמך על ידי קרן Mirae Asset, שמפתח מודלים לרובוטים מסחריים.
דובר גוגל מסר כי "המעבר מהפעלה בענן להפעלה מקומית מייצג צעד חשוב לעצמאות הרובוטים ולשימוש פרטי ותעשייתי בטוח יותר". לפי הערכות בשוק, הטכנולוגיה החדשה תאפשר בעתיד שילוב רובוטים חכמים בבתים, מחסנים, מפעלים ומערכות שירותים – ללא תלות ברשת.




