המודל החדש של נטפליקס: עכשיו ניתן להסיר אובייקטים מסרטונים

VOID של נטפליקס, הוא מודל חזותי-לשוני שנועד להסיר אלמנטים ספציפיים מסרטון ולעדכן את הקטעים כך שימשיכו כאילו לא נעשו בהם שינויים • המודל יודע להתמודד עם אינטראקציות מורכבות ויחסוך עלויות להפקות

נטפליקס | צילום: שאטרסטוק

נטפליקס הציגה מודל חדש המדגים כיצד ניתן להשתמש בבינה מלאכותית כדי להסיר אובייקטים מסרטונים ולערוך את הצילומים בהתאם.

VOID, המודל של נטפליקס, (Video Object and Interaction Deletion), הוא מודל חזותי-לשוני (VLM) שנועד להסיר אלמנטים ספציפיים מסרטון ולעדכן את הקטעים כך שימשיכו כאילו לא נעשו בהם שינויים.

כדוגמה, נטפליקס מציגה תמונות של שתי מכוניות דוהרות אחת לשנייה. בצילום המקורי, השתיים מתנגשות, אך באמצעות VOID, ניתן להסיר את המכונית הימנית, בעוד הרכב השמאלי ממשיך בנסיעה כאילו דבר לא קרה.

בעוד שקיימים כלים דומים מבוססי AI, כמו Runway, Generative Omnimatte ו-ProPainter, נטפליקס מנסה להראות מדוע VOID טוב יותר.

המודל יודע להתמודד עם אינטראקציות מורכבות, כמו הפגיעה בין המכוניות. המודל הסיר מכונית אחת מה שגרם למכונית השנייה להמשיך לנסוע. בנוסף, הטכנולוגיה עשויה לחסוך להפקות ענק מיליוני דולרים על ידי ביטול הצורך בצילומים חוזרים במקרה של טעויות או צורך בשינויים קלים.

החברה גם ערכה סקר בקרב 25 אנשים בחמישה תרחישים שונים ומצאה כי VOID הועדף ב-64.8% מהמקרים, לעומת Runway שהגיעה למקום השני עם 18.4%.

למרות זאת, נותרו ספקות לגבי הטכנולוגיה הזו. ראשית התמונות שנטפליקס שיתפה הן מסרטונים שצולמו באזורים ריקים. קשה לקבוע איך הוא יעבוד באזורים צפופים עם הרבה פרטים.

בכל מקרה, טכנולוגיה כמו VOID כננראה לא תיעלם בקרוב. החברה הוציאה לאחרונה 600 מיליון דולר כדי לרכוש את InterPositive, סטארט-אפ ה-AI של בן אפלק.

נטפליקס תשלם עד 600 מיליון דולר עבור חברת ה-AI של בן אפלק

הסטארט-אפ מציע כלים קנייניים ליוצרים כדי לסייע להם בתהליך עשיית הסרטים. אפלק דיבר בעבר על החשיבות של שימוש בבינה מלאכותית בקולנוע אך לא ברור כיצד נטפליקס עשויה להשתמש ב-InterPositive בהמשך הדרך.