גוגל (Google) הכריזה על Whisk ו-Veo 2, שני כלים חדשים ליצירת תוכן ויזואלי המשלבים את מודלי הבינה המלאכותית המתקדמים שלה. הכלים החדשים מיועדים ליצירה קלה ומהירה של תמונות וסרטונים ברמת דיוק ואיכות גבוהה, ומבוססים על Imagen 3, מודל יצירת התמונות החדש של החברה.
Whisk: תמונות בעזרת פרומפטים ויזואליים
Whisk, הניסוי החדש מבית Google Labs, מציע חוויית יצירה חדשנית: במקום להקליד תיאורים טקסטואליים ארוכים, הכלי מאפשר להעלות תמונות כפרומפטים. ניתן להגדיר את הנושא, הסצנה והסגנון בעזרת שילוב של תמונות שונות – או פשוט להשתמש באפשרות של הגרלה אוטומטית דרך אייקון הקוביות.
אם התוצאה דורשת דיוק נוסף, ניתן לשלב טקסט כדי לחדד את ההוראות או לערוך את הפרומפט שנוצר. התהליך מהיר, אינטואיטיבי ומיועד לחוויית “חקר ויזואלי מהיר”, כפי שגוגל מדגישה.
Imagen 3, המודל שמאחורי הכלי, מספק שיפור משמעותי ביצירת תמונות: קומפוזיציה משופרת, צבעים מדויקים ויכולת לעקוב טוב יותר אחרי הנחיות המשתמש. המודל מתאים למגוון רחב של סגנונות, מריאליזם ועד איורים מופשטים.
Veo 2: וידאו באיכות קולנועית
לצד Whisk, גוגל השיקה את Veo 2, המודל החדש ליצירת סרטונים. Veo 2 מאפשר ליצור סרטונים ברזולוציית 4K ובאורך של דקות, תוך שמירה על דיוק בתנועות אנושיות והבנה של חוקי הפיזיקה.
המודל נועד להעניק שליטה קולנועית למשתמשים: ניתן לבחור זוויות מצלמה, עדשות ואפקטים. לדוגמה, אפשר לבקש "צילום עם עדשת 18 מ"מ" או "שדה עומק רדוד" כדי ליצור סרטונים שמדמים צילום מקצועי.
על פי גוגל, יתרון נוסף של Veo 2 הוא הפחתה בתופעות ה"הזיה" הנפוצות במודלים מתחרים, כמו יצירת פרטים שגויים או אובייקטים לא רצויים. בנוסף, גוגל מיישמת בכלי את טכנולוגיית SynthID, שמספקת סימון בלתי נראה המזהה את התוכן ככזה שנוצר על ידי בינה מלאכותית – מה שמסייע במניעת הפצת מידע מטעה.
זמין באופן חלקי, בארה"ב
Whisk זמין כעת בארה”ב דרך פלטפורמת Google Labs. הכלי השני, Veo 2, נפתח בהדרגה למשתמשים דרך VideoFX של גוגל, עם תוכניות להרחיב אותו ל-YouTube Shorts ומוצרים נוספים במהלך השנה הקרובה.
השקת Whisk ו-Veo 2 מציגה את החזון של גוגל ליצירה ויזואלית נגישה ומתקדמת. עם השיפורים במודל Imagen 3, הכלים מציעים תוצאות מדויקות וגמישות יצירתית, אך גוגל מדגישה שהטכנולוגיות עדיין בשלבי פיתוח מוקדמים. האתגרים הקיימים, כמו פערים בתוצרים, מותירים פתח לשיפור נוסף ולשאלה כיצד הכלים יתפתחו וייטמעו בשימושים רחבים בעתיד.