ChatGPT מזהה מיקום מדויק – רק מתמונה

GPT-o3 מזהה מיקומים מתמונות על סמך הסקה מתקדמת • המערכת מציגה את שלבי החשיבה שלה בפירוט • משתמשים מדווחים על הצלחות בזיהוי חופים, ערים ואפילו רחובות מדויקים

ChatGPT | צילום: MrDm, פריפיק

בעשור האחרון, ניתוח תמונות בינה מלאכותית התפתח מקטלוג עצמים בסיסי לזיהוי מתקדם של פרטים מרחביים. אך כעת, עם השקת GPT-o3 כחלק ממערכת ChatGPT Plus, נפרץ גבול נוסף: היכולת לשער את מיקום הצילום רק מתוך פרטים חזותיים בתמונה – אפילו ללא כל נתון GPS.

GPT-o3 הוא מודל המבוסס על "הסקה מתקדמת" ולא רק על למידת תבניות חזותיות. זה אומר שלא מדובר רק בזיהוי עצמים, אלא גם בשילוב היגיון מרחבי, אנליזה סיבתית וניסיון להבין "מה אומר כל פרט בתמונה". המודל פועל בזמן אמת ומציג את שלבי החשיבה – כמה זמן לקח לכל ניתוח, מהו הפרט שמשך את תשומת הלב, אילו חלופות שקלו, ועוד.

בבדיקות שנערכו במסגרת ניסוי משתמשים רחב היקף, זוהו מיקומים מגוונים – מחוף קייפ ורדה, דרך בניינים במידטאון מנהטן, ועד אתרי נופש באיים הקריביים. המודל ניתח צבעי שמיים, סוג סלעים, סגנון בנייה, וכיתוב על שלטים והצליח לשחזר את המיקום בדיוק מדהים.

במקרה של תמונה בניו יורק, המודל הצליח לזהות לא רק את הרחוב והעיר, אלא גם את מספר הבית – תוך שימוש בשלטי חנויות, קווי ראייה ומאפיינים ייחודיים של מבנים. בתמונות קשות יותר, כמו צילומים מטושטשים או כאלה עם מכשולים פיזיים, המודל עדיין הצליח לזהות את המדינה או האזור הגאוגרפי – אך לעיתים עם רמת ביטחון נמוכה יותר.

השאלה הגדולה שעולה כעת היא לא טכנולוגית – אלא חברתית ורגולטורית. האם ראוי לאפשר לכל אחד לזהות היכן צולמה תמונה של אדם, בלי לשאול את הסכמתו? האם מדובר בכלי משחק, או בבעיה של פרטיות?

בינתיים, המודל הופך למשחק חברתי מרתק – אך עתידו עשוי להשפיע גם על כלי אבטחה, תקשורת, פרסום ואף פעילות של גופי אכיפה. הגבול בין ניתוח תמים לבין ניטור בעייתי – הופך למטושטש מתמיד.

ChatGPT OpenAI בינה מלאכותית