חברת OpenAI הודיעה היום (חמישי) על השקת סדרת המודלים החדשה שלה, GPT-5.2, המיועדת בעיקר לשימוש מקצועי ולביצוע משימות מורכבות. ההכרזה כוללת שלוש וריאציות של המודל: GPT-5.2 Instant לביצועים מהירים, GPT-5.2 Thinking למשימות הדורשות חשיבה עמוקה, ו-GPT-5.2 Pro המיועד לאתגרים המורכבים ביותר.
על פי נתוני החברה, גרסת ה-Thinking של המודל החדש מציבה רף חדש בתעשייה. במבחן ה-GDPval, המודד ביצועי משימות ידע על פני 44 מקצועות שונים, המודל הצליח להשוות או לנצח ביצועים של מומחים אנושיים ב-70.9% מהמקרים. הישג זה הופך אותו למודל הראשון של החברה שמגיע לרמת מומחיות אנושית במגוון רחב של מטלות כלכליות, החל מיצירת מצגות וגיליונות אלקטרוניים ועד לניתוח פיננסי מורכב.

בתחום הפיתוח והתכנות, GPT-5.2 מציג שיפור ניכר. במבחן SWE-Bench Verified, המודל השיג ציון של 80%, ובמבחן SWE-Bench Pro המחמיר יותר, התומך בארבע שפות תכנות שונות, המודל הגיע ל-55.6%. משמעות הדבר היא יכולת גבוהה יותר בתיקון באגים בקוד קיים, הטמעת פיצ'רים חדשים וביצוע Refactoring (שכתוב קוד) בצורה אוטונומית יותר מבעבר. החברה מציינת גם שיפורים משמעותיים ביכולות ה-Front-end ובעבודה עם ממשקי משתמש מורכבים.
אחת הנקודות הקריטיות עליהן שמה OpenAI דגש היא אמינות המידע. המודל החדש מציג ירידה של כ-30% בשיעור ה"הזיות" בהשוואה לגרסה הקודמת, GPT-5.1. בנוסף, יכולות הזיכרון וחלון ההקשר (Context Window) שודרגו משמעותית. המודל מסוגל כעת לעבד ולנתח מסמכים ארוכים במיוחד, תוך שמירה על דיוק של כמעט 100% במבחני שליפת מידע עד להיקף של 256,000 טוקנים.
גם היכולות החזותיות (Vision) זכו לשדרוג. המודל מסוגל לנתח תרשימים טכניים, צילומי מסך של מוצרים ודוחות ויזואליים בדיוק רב יותר. בהדגמה שביצעה החברה, המודל הצליח לזהות רכיבים על לוח אם של מחשב ולמקם אותם מרחבית בצורה מדויקת, משימה שבה מודלים קודמים התקשו.

המודלים החדשים זמינים החל מהיום ב-ChatGPT למנויי Plus, Pro, Team ו-Enterprise. גרסת ה-Instant מיועדת לשימוש יומיומי מהיר, גרסת ה-Thinking מיועדת למשימות הדורשות תכנון וניתוח, וגרסת ה-Pro (היקרה יותר בשימוש ב-API) מיועדת למקרים בהם נדרשת האיכות הגבוהה ביותר ללא פשרות. עבור מפתחים, המודלים זמינים דרך ה-API במחיר של 1.75 דולר למיליון טוקנים של קלט ו-14 דולר למיליון טוקנים של פלט עבור גרסת ה-Thinking.
OpenAI ציינה כי העדכון פותח בשיתוף פעולה הדוק עם NVIDIA ומיקרוסופט, תוך שימוש בתשתיות הענן של Azure ובמעבדים הגרפיים המתקדמים ביותר. החברה הדגישה כי לצד השיפורים בביצועים, הוטמעו מנגנוני בטיחות חדשים המפחיתים את הסיכוי לתגובות הכוללות תוכן פוגעני או מסוכן.
