OpenAI הודיעה על שחרור גרסה חדשה ומשמעותית ל-ChatGPT Images, המנוע הגרפי המוטמע בתוך הצ'אטבוט שלה. השדרוג מבוסס על מודל חדש לחלוטין, המכונה בגרסת המפתחים GPT Image 1.5, והוא נועד לפתור את אחת הבעיות המתסכלות ביותר בתחום ה-AI הגנרטיבי: חוסר העקביות בעריכת תמונות.
עד היום, בקשה לשינוי פרט קטן בתמונה (כמו החלפת בגד או שינוי רקע) גררה לרוב יצירה מחדש של כל התמונה, מה שגרם לאובדן הפרטים המקוריים כמו פני הדמות או הקומפוזיציה. המודל החדש משנה את כללי המשחק ומציג יכולת עריכה כירורגית. המערכת מסוגלת כעת להבין את הכוונה המדויקת של המשתמש ולבצע שינויים ספציפיים, כמו הוספה, הסרה או שילוב אלמנטים, תוך שמירה קפדנית על הסגנון, התאורה והמראה של הדמויות המקוריות.
המשמעות היא ש-ChatGPT הופך לכלי עבודה (סטודיו בכיס) שימושי הרבה יותר עבור מעצבים ומשתמשים עסקיים. ניתן, למשל, לקחת דמות שנוצרה, להחליף לה בגדים, לשנות את הרקע ממסיבה לשידור חי, ואפילו להוסיף דמויות נוספות, וכל זאת מבלי שהדמות הראשית תשתנה או תתעוות בתהליך.


מעבר לדיוק, השדרוג מביא עמו שיפור דרמטי בביצועים. לפי OpenAI, המודל החדש מייצר תמונות במהירות של עד פי 4 בהשוואה לגרסה הקודמת (DALL-E 3). שיפור נוסף נרשם בגזרת הטקסט, מחוללי תמונות ידועים לשמצה בחוסר היכולת שלהם לכתוב מילים בצורה קריאה בתוך תמונות. GPT Image 1.5 מציג יכולת משופרת לרינדור טקסט צפוף וקטן, מה שמאפשר יצירת פוסטרים, אינפוגרפיקות ועיצובים הכוללים כיתוב מדויק.
לצד המודל הטכני, OpenAI משיקה גם חוויית משתמש חדשה בתוך הממשק של ChatGPT. משתמשים יראו כעת לשונית ייעודית ל"תמונות" בסרגל הצד, המציעה גישה מהירה ליצירה ויזואלית. האזור החדש כולל פילטרים מוכנים מראש, סגנונות טרנדיים ואפשרות להעלאת "רפרנס" (כמו תמונת פנים) לשימוש חוזר, כך שלא צריך להעלות את אותה תמונה שוב ושוב בכל יצירה חדשה.
עבור מפתחים המשתמשים ב-API של החברה, המודל החדש זמין תחת השם GPT Image 1.5 ומגיע עם בשורה כלכלית, עלות השימוש בו זולה ב-20% בהשוואה למודל הקודם, מה שצפוי לעודד שילוב של יכולות אלו באפליקציות צד שלישי.


הפריסה של המודל החדש החלה היום לכלל המשתמשים ב-ChatGPT (כולל משתמשים חינמיים ובתשלום), כאשר הממשק הייעודי בסרגל הצד יגיע בהדרגה למרבית המשתמשים בימים הקרובים, ולמשתמשים עסקיים (Enterprise) בשלב מאוחר יותר.
