חברת OpenAI משיקה את מה שעשוי להיות השדרוג המשמעותי ביותר ליכולות של ChatGPT מאז השקתו: "סוכן ChatGPT" (ChatGPT agent). מדובר במצב חדש שהופך את הצ'אטבוט מכלי מחקר ותשובות פסיבי לסוכן אקטיבי שיכול לבצע משימות מורכבות ורב-שלביות בעצמו, תוך שימוש במחשב וירטואלי ייעודי. יכולת זו, הזמינה החל מהיום למשתמשי Pro, Plus ו-Team, מגשרת על הפער בין מחקר לבין פעולה ממשית.
בבסיס היכולת החדשה עומדת מערכת אחודה המשלבת את החוזקות של פרויקטים קודמים של החברה: היכולת של "Operator" לתקשר עם אתרי אינטרנט (ללחוץ, להקליד ולגלול), עם היכולת של "Deep Research" לנתח ולסכם מידע לעומק. כעת, במצב "סוכן", ChatGPT יכול לבצע מטלות כמו "תכנן וקנה מצרכים לארוחת בוקר יפנית לארבעה אנשים" או "נתח שלושה מתחרים וצור מצגת מסכמת". הוא יעשה זאת על ידי גלישה באתרים, סינון תוצאות, הרצת קוד לניתוח נתונים, ואף יצירת מצגות וגיליונות אלקטרוניים הניתנים לעריכה.
לצורך ביצוע המשימות, ל"סוכן" יש ארגז כלים מגוון: דפדפן ויזואלי ודפדפן טקסטואלי, טרמינל להרצת פקודות קוד, וגישה לחיבורים (Connectors) לאפליקציות חיצוניות כמו Gmail או Github. למרות היכולות האוטונומיות, OpenAI מדגישה שהמשתמש נשאר תמיד בשליטה. ה"סוכן" יבקש אישור מפורש לפני ביצוע פעולות בעלות השלכות ממשיות (כמו רכישה), והמשתמש יכול לעצור את המשימה בכל רגע, להשתלט על הדפדפן בעצמו, או לתת הוראות חדשות.

עם היכולות החדשות מגיעים גם סיכונים חדשים, ו-OpenAI מודעת לכך. החברה מציינת כי הטמיעה מנגנוני הגנה מורחבים, במיוחד נגד "הזרקת פרומפטים" (ניסיונות של גורמים זדוניים להשפיע על פעולת הסוכן דרך תוכן באתרים בהם הוא מבקר). בנוסף, מתוך זהירות מרבית, החברה מתייחסת ליכולות החדשות כבעלות פוטנציאל סיכון ביולוגי וכימי גבוה, והפעילה את מנגנוני הבטיחות המחמירים ביותר שלה עד כה בתחום.
החברה גם הציגה שלל תוצאות ממבחני ביצועים (בנצ'מרקים) המראים כי ה"סוכן" החדש מציב רף ביצועים חדש, ובמשימות רבות אף מתעלה על ביצועי מומחים אנושיים. זהו צעד משמעותי לעבר עתיד שבו הבינה המלאכותית היא לא רק מקור מידע, אלא שותפה פעילה בביצוע מטלות יומיומיות ומקצועיות.