Google DeepMind представив нову модель для ШІ-редагування зображень — Gemini 2.5 Flash Image, більш відому під внутрішньою назвою nano banana. Саме вона вийшла на перше місце в рейтингу LMArena з редагування зображень і вже доступна у застосунку Gemini, повідомляє Ars Technica.
У чому новизна?
Традиційна проблема генеративної графіки — непередбачуваність: при кожному редагуванні об’єкти змінювалися занадто випадково. Nano banana вирішує цю проблему: модель зберігає послідовність і впізнаваність деталей, пам’ятаючи риси вихідного зображення навіть після кількох кроків редагування.
Google зазначає, що це дозволяє:
⇾ змінювати стиль чи одяг людини (наприклад, перетворити її на матадора чи героя ситкому 90-х), при цьому зберігаючи риси обличчя;
⇾ виконувати серію редагувань без «затирання» вихідних рис;
⇾ комбінувати кілька фото в одну сцену (наприклад, створити новий знімок, де пес обіймається з власницею, на основі двох окремих фото).
Чому це важливо
Модель відкриває ширші сценарії застосування: від професійної роботи з візуальним контентом до більш креативних побутових завдань. При цьому всі результати позначаються видимим водяним знаком AI та невидимим SynthID, який залишається навіть після помірного редагування.
Де доступно
• Вже сьогодні — у застосунку Gemini.
• Незабаром — у Gemini API, AI Studio та Vertex AI, що дозволить розробникам інтегрувати модель у власні сервіси.
Раніше ми повідомляли, що Google додає нові відеоінструменти на базі ШІ до Google Photos і YouTube Shorts.
Читайте також на ProIT, чи може Google Veo 3 стати основою для ігрових світів?
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!