o3 של OpenAI עקף את המתחרים במבחן תכנות – כל הפרטים

OpenAI חשפה את o3 ו-o4-mini עם יכולת לנתח שאלות לפני מענה • המודלים תומכים בהרצת קוד, עיבוד תמונה וגלישה ישירה מהפלטפורמה • o3 מציג ביצועים גבוהים במיוחד במדדים של תכנות, מתמטיקה ומדע • הוא כולל יכולת ניתוח תמונות כחלק מתהליך החשיבה

ChatGPT | צילום: MrDm, פריפיק

השקת המודלים o3 ו-o4-mini על ידי OpenAI מסמנת ציון דרך נוסף בהתפתחות תחום הבינה המלאכותית, ומבליטה מגמה מובהקת של העמקת יכולות "הסקת מסקנות" ו"חשיבה שיטתית" במודלים מתקדמים. שלא כמו דגמים מוקדמים שהתבססו על השלמות טקסט מהירות ושטחיות יחסית, המודלים החדשים מתעכבים לצורך עיבוד מעמיק של השאלה, מבצעים שלבי ניתוח וחשיבה פנימיים – ורק אז מגיבים.

OpenAI ממצבת את o3 כמודל החזק ביותר שפיתחה עד כה בתחום ההיגיון, והוא נבחן בהצלחה על מבחנים סטנדרטיים הנוגעים למתמטיקה, קידוד, מדע, הבנה ויזואלית וניתוח מצבים מורכבים. בין המבחנים האלה ניתן למצוא את SWE-bench, מבחן מקובל לבדיקת יכולות פתרון בעיות תכנות ללא תמיכה חיצונית. התוצאה של o3 – 69.1% – היא הגבוהה ביותר מבין כלל המודלים של OpenAI עד כה, ובפער ניכר מהדגם הקודם o3-mini שקיבל 49.3%.

לצידו עומד o4-mini, שנבנה כתשובה לצרכים אחרים של השוק: יעילות, מהירות ועלות. OpenAI טוענת כי מדובר במודל קל יותר שמספק ביצועים קרובים מאוד ל-o3, אך במחיר נמוך יותר וזמן תגובה מהיר במיוחד – מה שהופך אותו רלוונטי מאוד למפתחי אפליקציות, בייחוד כאלה המחפשים איזון בין משאבים וביצועים.

סם אלטמן: "הבינה שתכיר את כל חייך כבר כאן"

בשונה ממודלים קודמים, o3 ו-o4-mini לא רק משיבים לשאלות טקסטואליות, אלא פועלים בשילוב כלים נוספים כמו גלישה ברשת, עיבוד תמונה, הרצת קוד פייתון, ויצירת תמונות – כל זאת ישירות מתוך ממשק ChatGPT. כך, למשל, ניתן להעלות שרטוט או תמונה מטושטשת, ולבקש מהמודל להסביר מה רואים בה, לבצע ניתוח מתמטי או פיזיקלי של התוכן ואף להתאים את זווית הצפייה או לבצע סיבוב לתמונה. זוהי מהפכה ביכולת להבין מידע חזותי כחלק ממערכת מחשבתית רבת שלבים.

גרסה משופרת של o4-mini, בשם o4-mini-high, מיועדת למי שמחפש תשובות מדויקות ואמינות יותר, על חשבון מהירות תגובה. לפי החברה, גרסה זו שוהה זמן ארוך יותר ב"שלב החשיבה" הפנימי, במטרה להבטיח תגובה שקולה יותר.

כל המודלים זמינים כבר כעת למנויי התוכניות Pro, Plus ו-Team של ChatGPT, ובמקביל גם למפתחים באמצעות ה-Chat Completions API וה-Responses API. כך, ניתן לשלבם באופן גמיש במערכות צד ג’, אפליקציות ואתרים.

OpenAI מתמחרת את o3 במחיר תחרותי ביחס לביצועיו: 10 דולר (כ-37 שקל) למיליון טוקנים קלט, ו-40 דולר (כ-147 שקל) למיליון טוקנים פלט. o4-mini, לעומתו, ממשיך את תמחורו של o3-mini: 1.10 דולר (כ-4 שקל) לקלט ו-4.40 דולר (כ-16 שקל) לפלט.

יש לציין כי ההשקה של o3 הייתה במקור לא ודאית. מנכ"ל OpenAI סם אלטמן הצהיר בפברואר שהחברה תעדיף להשקיע בפתרון חדש ומקיף שישלב את טכנולוגיות o3, אך ככל הנראה הלחץ מצד המתחרים הביא לשינוי אסטרטגיה. שוק הבינה המלאכותית נמצא כעת בתחרות גלובלית מתוחה בין ענקיות כמו גוגל, מטא, Anthropic, xAI של אילון מאסק, ו-DeepSeek הסינית – וכל השהייה עלולה להיתפס כחולשה.

מנקודת מבט עסקית, שילוב המודלים החדשים מספק ל-OpenAI יתרון גם בעולם השירותים למפתחים – שכן שילוב יכולות כמו עיבוד תמונה והרצת קוד בזמן אמת מרחיב משמעותית את הפוטנציאל של יישומי בינה מלאכותית בתחומים כמו שירות לקוחות, רפואה, תעשייה, חינוך ופיתוח תוכנה.

OpenAI מפתחת רשת חברתית מבוססת בינה עם ChatGPT

גרסה עתידית בשם o3-pro, שתשתמש ביותר משאבים לצורך עיבוד עמוק של שאלות, מתוכננת לצאת בשבועות הקרובים למנויי ChatGPT Pro בלבד. מדובר בגרסה שצפויה להוות גשר טכנולוגי בין הדור הנוכחי לבין GPT-5, המודל המאוחד העתידי של OpenAI.

סם אלטמן עצמו רמז כי ייתכן ומדובר באחרוני הדגמים העצמאיים של מודלי ההיגיון. לפי חזונו, GPT-5 יהפוך לפלטפורמה מאוחדת שתאגד את כל יכולות העבר – כולל שפה, תכנות, ראייה וחשיבה – לכדי ישות אחת רציפה.

ChatGPT OpenAI בינה מלאכותית עדכונים