חטיבת הבינה המלאכותית של מיקרוסופט (Microsoft AI) מכניסה הילוך גבוה ומשיקה רשמית את מחולל התמונות הראשון שפותח כולו בתוך החברה, MAI-Image-1. המודל החדש, שהוכרז לראשונה באוקטובר, זמין כעת לשימוש הציבור בשני מוצרים מרכזיים, בתוך מחולל התמונות של בינג (Bing Image Creator) וכן במוצר חדש בשם Copilot Audio Expressions. המהלך מסמן צעד אסטרטגי משמעותי עבור מיקרוסופט, המבקשת להפחית את תלותה המוחלטת במודלים של שותפתה המרכזית, OpenAI.

ההכרזה על הזמינות המיידית הגיעה מפי מוסטפא סולימאן, מנכ"ל Microsoft AI. סולימאן ציין בפוסט ברשת X (טוויטר לשעבר) כי המודל "מצטיין במיוחד" ביצירת תמונות של אוכל וסצנות טבע, וכן בתאורה אמנותית ופרטים פוטוריאליסטיים. עם זאת, הוא הדגיש כי המודל עדיין אינו זמין למשתמשים במדינות האיחוד האירופי, אך "יגיע לשם בקרוב".
במידע נוסף שפרסמה החברה, מיקרוסופט (Microsoft) מרחיבה על יכולותיו של MAI-Image-1. לפי התיאור הרשמי, המודל מצטיין ביצירת דימויים פוטוריאליסטיים, במיוחד בהיבטים של תאורה מורכבת (כגון החזרי אור ואור קופץ), נופים ועוד. בניגוד למודלי ענק אחרים בשוק, שלעיתים הינם איטיים יותר, במיקרוסופט מדגישים כי היתרון המרכזי של המודל החדש הוא השילוב בין מהירות לאיכות. שילוב זה מאפשר למשתמשים "להעלות את הרעיונות שלהם על המסך מהר יותר, לבצע איטרציות במהירות, ולאחר מכן להעביר את עבודתם לכלים אחרים להמשך עידון".
גלריה: MAI-Image-1




השילוב השני של המודל, ב-Copilot Audio Expressions, חושף כיוון מעניין. פלטפורמה זו מאפשרת יצירת סיפורי אודיו באמצעות AI, ו-MAI-Image-1 ישמש כעת ליצירת "אמנות AI" שתלווה את אותם סיפורים במצב "Story Mode".
השקת מחולל התמונות העצמאי היא חלק מאסטרטגיה רחבה יותר שהחלה להתגבש באוגוסט האחרון. אז, הכריזה מיקרוסופט על דגמי ה-AI הפנימיים הראשונים שלה, מודל הדיבור MAI-Voice-1 ומודל הטקסט MAI-1-preview. כבר בזמנו, החברה רמזה כי היא מתכננת להשתמש במודל הטקסט שלה בתוך Copilot במקרים מסוימים, במה שנתפס כאות לבאות לבדיקת חלופות והפחתת התלות ב-OpenAI.

חשוב לציין כי מיקרוסופט אינה זונחת את OpenAI. נכון להיום, ה-Copilot chatbot הראשי של החברה נמצא בתהליך מעבר למודל החדש ביותר של OpenAI, ה-GPT-5, ובמקביל מציע למשתמשים גם את מודלי Claude של Anthropic כאופציה. אך כעת, בתחום יצירת התמונות, מיקרוסופט מציבה את הטכנולוגיה הביתית שלה בתחרות ישירה. באתר ובאפליקציית Bing Image Creator, מופיע MAI-Image-1 כאחד משלושה מודלים זמינים לבחירה, לצד שני המודלים המתחרים מבית OpenAI – DALL-E 3 ו-GPT-4o.
