ChatGPT מצטרף לג'מיני: משיק יכולות עיצוב ועריכה גרפית

OpenAI השיקה גרסה חדשה ל-GPT-4o המאפשרת לראשונה יצירה ועריכת תמונות באופן מובנה בתוך ChatGPT • ההשקה מגיעה לאחר השקת פיצ'ר דומה של גוגל במודל Gemini, שספג ביקורת בשל היעדר מגבלות אתיות

ChatGPT | צילום: MrDm, פריפיק

חברת OpenAI השיקה השבוע שדרוג משמעותי ליכולות הוויזואליות של ChatGPT, כשהוסיפה למודל GPT-4o אפשרות מובנית ליצירה ועריכה של תמונות. מדובר בעדכון ראשון מסוגו זה למעלה משנה, המרחיב את גבולות הבינה המלאכותית של החברה ומבסס את ChatGPT ככלי חזותי ולא רק טקסטואלי. המערכת החדשה מאפשרת יצירה מדויקת יותר של תמונות על פי הוראות טקסט, וכן עריכה של תמונות קיימות באופן אינטראקטיבי ומבוסס הקשר.

העדכון כבר זמין למנויי תוכנית ChatGPT Pro, שמחירה 200 דולר לחודש, וכן למשתמשי פלטפורמת הווידאו Sora של OpenAI. בהמשך, צפויה ההרחבה להגיע גם למשתמשים בגרסת Plus, לגרסה החינמית של ChatGPT ולמפתחים המשתמשים ב-API של החברה. GPT-4o מחליף למעשה את מודל DALL·E 3, ששימש עד כה ככלי הדמיה הוויזואלי המרכזי של OpenAI. בניגוד לקודמו, המודל החדש “חושב” זמן רב יותר אך מספק תוצרים מדויקים ועשירים יותר בפרטים.

לצד היכולת ליצור תמונות חדשות, המערכת מאפשרת כעת עריכה של תמונות קיימות, לרבות כאלה הכוללות אנשים. ניתן לשנות רקעים, להוסיף אובייקטים או להסיר פרטים לא רצויים, וכל זאת מבלי לפגוע בשלמות ההקשר הוויזואלי. בין השאר, משולבת במודל טכנולוגיית “inpainting” שמאפשרת שחזור חלקים בתמונה או יצירת אזורים שלמים בהתאם להוראות המשתמש.

לצורך אימון המודל, OpenAI השתמשה בנתונים ציבוריים זמינים ובמאגרי מידע שהושגו באמצעות שיתופי פעולה עם חברות תוכן מסחריות, בהן Shutterstock. עם זאת, החברה נמנעת מלחשוף פרטים מדויקים על מקורות האימון, ככל הנראה עקב רגישויות הקשורות לקניין רוחני ולתחרות גוברת בתחום. חברות רבות בתחום הבינה המלאכותית רואות במידע האימוני נכס אסטרטגי, ולכן שומרות אותו חסוי.

בהתייחס לשאלות סביב זכויות יוצרים, ציין סמנכ"ל התפעול של OpenAI, בראד לייטקאפ, כי החברה מונעת מהמערכת להפיק תמונות המחקות באופן ישיר סגנונות של אמנים פעילים. לדבריו, קיימות מדיניות וכלים פנימיים שמונעים מהמודל ליצור תוצרים הדומים ליצירות קיימות. כמו כן, החברה מאפשרת ליוצרים להגיש בקשה להסרת עבודותיהם ממאגרי האימון, ומכבדת בקשות אתרים שלא מעוניינים להיכלל באיסוף המידע.

השדרוג בוצע זמן קצר לאחר שגוגל חשפה מודל חדש הכולל יכולות תמונה מובנות. חשיפה זו עוררה סערה ברשתות החברתיות לאחר שהתברר כי הכלי איפשר בין היתר להסיר סימני מים וליצור דמויות המוגנות בזכויות יוצרים, מבלי שהוטמעו מנגנוני סינון מתאימים. המהלך של OpenAI נתפס כניסיון לספק חלופה זהירה ומבוקרת יותר לפיתוחים מקבילים.

ChatGPT Gemini OpenAI בינה מלאכותית בינה מלאכותית גנרטיבית עדכונים