Google покращує редагування зображень у Gemini завдяки моделі nano banana

Google DeepMind представив нову модель для ШІ-редагування зображень — Gemini 2.5 Flash Image, більш відому під внутрішньою назвою nano banana. Саме вона вийшла на перше місце в рейтингу LMArena з редагування зображень і вже доступна у застосунку Gemini, повідомляє Ars Technica.

У чому новизна?

Традиційна проблема генеративної графіки — непередбачуваність: при кожному редагуванні об’єкти змінювалися занадто випадково. Nano banana вирішує цю проблему: модель зберігає послідовність і впізнаваність деталей, пам’ятаючи риси вихідного зображення навіть після кількох кроків редагування.

Google зазначає, що це дозволяє:

⇾ змінювати стиль чи одяг людини (наприклад, перетворити її на матадора чи героя ситкому 90-х), при цьому зберігаючи риси обличчя;

⇾ виконувати серію редагувань без «затирання» вихідних рис;

⇾ комбінувати кілька фото в одну сцену (наприклад, створити новий знімок, де пес обіймається з власницею, на основі двох окремих фото).

0:00

Чому це важливо

Модель відкриває ширші сценарії застосування: від професійної роботи з візуальним контентом до більш креативних побутових завдань. При цьому всі результати позначаються видимим водяним знаком AI та невидимим SynthID, який залишається навіть після помірного редагування.