הביצועים השתפרו, ההזיות ירדו: מה באמת שווה GPT-4.1?

המודל משפר את הביצועים בקוד בשיעור של מעל 20% לעומת GPT-4.0 • החברה מציגה הוזלה ממוצעת של 26% בעלות השימוש ב-GPT-4.1 לעומת הגרסה הקודמת • מודלי Mini ו-Nano מציעים מחירים אף נמוכים יותר

צ'אט GPT של OpenAI | קרדיט: T. Schneider, שאטרסטוק

OpenAI הכריזה על שלושה מודלים חדשים תחת השם GPT-4.1: המודל הראשי, GPT-4.1, ושני מודלים נוספים בשם Mini ו-Nano. ההשקה מסמנת התקדמות טכנולוגית ניכרת ביחס לגרסה הקודמת, GPT-4.0, עם שיפורים בולטים בהיקף ההקשר, הביצועים בעולם האמיתי, המחיר והדיוק. כל אחד מהם מותאם לסוג אחר של שימושים, עם שילוב בין עוצמה, מהירות ועלות נמוכה יותר – מה שהופך את החבילה החדשה למתאימה גם למפתחים עצמאיים וגם לארגונים גדולים.

שדרוג הליבה המרכזית של המודל הוא חלון הקשר של מיליון טוקנים – פי כמעט שמונה מהגרסה הקודמת (128,000 טוקנים ב-GPT-4.0). מדובר בקפיצה אדירה שמאפשרת למודל לעבד טקסטים באורך של מספר ספרים במקביל, להבין הקשרים מורכבים ולעבוד עם קבצים ארוכים או מערכות מידע מסועפות – קריטי לסביבות מבוססות סוכנים או עיבוד מסמכים רחבים.

הבדיקה של Scale, גוף צד ג' המתמחה בהערכת ביצועים של מודלים, מצאה כי GPT-4.1 ביצע שיפורים של 10% ביכולת לעקוב אחרי הוראות מורכבות, תוך ירידה משמעותית באחוזי ההזיות – אחת הבעיות המרכזיות בשימוש במודלי שפה. במדד הקוד (SWE-benchmark), המודל השיג תוצאה של 54% – מעל 20% יותר מהתוצאה של GPT-4.0. משמעות הדבר היא שהמודל יכול לא רק לכתוב קוד אלא גם לקרוא, לנתח ולתקן קוד באיכות גבוהה.

סם אלטמן: "הבינה שתכיר את כל חייך כבר כאן"

למרות שמדובר במודל משופר, OpenAI לא העלתה את המחירים. ההפך – היא הודיעה על ירידה של 26% בממוצע בעלות לשאילתה ביחס ל-GPT-4.0, תוך שמירה על אותן היכולות ואף שיפורן. בנוסף, הדגמים הקלים יותר – GPT-4.1 Mini ו-GPT-4.1 Nano – מציעים ביצועים טובים בהקשרים צרים, במחיר זול משמעותית, מה שיכול לשנות את כללי המשחק עבור שירותים המוניים, צ'אטבוטים או ממשקים עסקיים.

היתרונות ניכרים גם בתחום המולטימדיה, אף שמדובר בשיפור מתון יותר: המודל משיג שיפור של 6%-7% ביכולת ניתוח וידאו ואודיו. המודלים עדיין מוגבלים בזיהוי מדויק של מדיה מורכבת, אך המגמה ברורה – OpenAI ממשיכה להרחיב את היכולות הבינתחומיות של מודל השפה שלה.

נכון להיום, הגישה למודלים החדשים זמינה רק דרך ממשק ה-API או בפלטפורמת ה-Playground, אך ניתן להניח שבעתיד הקרוב הם יגיעו גם לשירות ChatGPT הרגיל. השימוש במודלים אלו, במיוחד לארגונים או מפתחים מקצועיים, פותח הזדמנויות חדשות לבניית מערכות חכמות יותר, מהירות יותר וזולות יותר.