Microsoft презентувала нову модель генерації зображень MAI-Image-2, яка стала першим серйозним кроком компанії до незалежності від OpenAI у цьому сегменті. Модель одразу посіла третє місце в рейтингу Arena.ai серед усіх сімейств генеративних моделей.
Раніше Microsoft використовувала моделі OpenAI для генерації зображень у своїх продуктах, зокрема Copilot і Bing Image Creator. Тепер компанія переходить до власної розробки, що дає їй можливість контролювати швидкість розвитку, витрати й інтеграцію AI у свої сервіси.
MAI (Microsoft AI) може стати новим брендом для внутрішніх AI-моделей компанії.
У рейтингу Arena.ai модель поступається лише рішенням від Google та OpenAI, а в деяких категоріях демонструє кращі результати. Зокрема, йдеться про фотореалізм і генерацію тексту в зображеннях — одну з ключових слабких сторін більшості AI-моделей.
За даними Microsoft, модель створювали у співпраці з фотографами, дизайнерами та креативними фахівцями. Основні технічні переваги:
- фотореалізм із природним освітленням і реалістичними текстурами;
- якісна генерація тексту (постери, інфографіка, написи);
- точне відтворення складних і деталізованих сцен.
Водночас MAI-Image-2 має низку обмежень. Серед них — жорсткі фільтри контенту, які можуть блокувати навіть безпечні запити, обмеження у 15 зображень на день і пауза до 30 секунд між генераціями.
Також наразі підтримується лише квадратний формат (1:1) без можливості створювати зображення у горизонтальному чи вертикальному співвідношенні. Немає функцій image-to-image, inpainting і роботи з референсами.
Модель уже доступна в MAI Playground і поступово інтегрується в Copilot і Bing Image Creator. API наразі відкритий лише для окремих enterprise-клієнтів. Ширший доступ через Microsoft Foundry очікується найближчим часом. Водночас сервіс поки недоступний у ЄС.
Нагадаємо, що минулого місяця Google запустила Nano Banana 2 із пришвидшеною генерацією зображень.