Microsoft представила нову модель генерації зображень MAI-Image-2, яка стала першим серйозним кроком компанії до незалежності від OpenAI у цьому сегменті. Модель одразу посіла третє місце в рейтингу Arena.ai серед усіх сімейств генеративних моделей.
Раніше Microsoft використовувала моделі OpenAI для генерації зображень у своїх продуктах, зокрема Copilot і Bing Image Creator. Тепер компанія переходить до власної розробки, що дозволяє їй контролювати швидкість розвитку, витрати та інтеграцію AI у свої сервіси.
MAI (Microsoft AI) може стати новим брендом для внутрішніх AI-моделей компанії.
У рейтингу Arena.ai модель поступається лише рішенням від Google і OpenAI, однак у деяких категоріях демонструє кращі результати. Зокрема, йдеться про фотореалізм і генерацію тексту в зображеннях — одну з ключових слабких сторін більшості AI-моделей.
За даними Microsoft, модель створювалася у співпраці з фотографами, дизайнерами та креативними фахівцями. Основні технічні переваги:
- фотореалізм із природним освітленням і реалістичними текстурами
- якісна генерація тексту (постери, інфографіка, написи)
- точне відтворення складних і деталізованих сцен
Водночас MAI-Image-2 має низку обмежень. Серед них — жорсткі фільтри контенту, які можуть блокувати навіть безпечні запити, обмеження у 15 зображень на день і пауза до 30 секунд між генераціями.
Також наразі підтримується лише квадратний формат (1:1), без можливості створювати зображення у горизонтальному чи вертикальному співвідношенні. Відсутні функції image-to-image, inpainting і робота з референсами.
Модель уже доступна в MAI Playground і поступово інтегрується в Copilot та Bing Image Creator. API наразі відкритий лише для окремих enterprise-клієнтів, але ширший доступ через Microsoft Foundry очікується найближчим часом.
При цьому сервіс поки що недоступний у ЄС.
Нагадаємо, минулого місяця Google запустила Nano Banana 2 з пришвидшеною генерацією зображень.