ProIT: медіа для профі в IT
Приблизно хвилину

Google покращує редагування зображень у Gemini завдяки моделі nano banana

author avatar ProIT NEWS

Google DeepMind представив нову модель для ШІ-редагування зображень — Gemini 2.5 Flash Image, більш відому під внутрішньою назвою nano banana. Саме вона вийшла на перше місце в рейтингу LMArena з редагування зображень і вже доступна у застосунку Gemini, повідомляє Ars Technica.

У чому новизна?

Традиційна проблема генеративної графіки — непередбачуваність: при кожному редагуванні об’єкти змінювалися занадто випадково. Nano banana вирішує цю проблему: модель зберігає послідовність і впізнаваність деталей, пам’ятаючи риси вихідного зображення навіть після кількох кроків редагування.

Google зазначає, що це дозволяє:

⇾ змінювати стиль чи одяг людини (наприклад, перетворити її на матадора чи героя ситкому 90-х), при цьому зберігаючи риси обличчя;

⇾ виконувати серію редагувань без «затирання» вихідних рис;

⇾ комбінувати кілька фото в одну сцену (наприклад, створити новий знімок, де пес обіймається з власницею, на основі двох окремих фото).

0:00
/

Чому це важливо

Модель відкриває ширші сценарії застосування: від професійної роботи з візуальним контентом до більш креативних побутових завдань. При цьому всі результати позначаються видимим водяним знаком AI та невидимим SynthID, який залишається навіть після помірного редагування.

Де доступно

• Вже сьогодні — у застосунку Gemini.

• Незабаром — у Gemini API, AI Studio та Vertex AI, що дозволить розробникам інтегрувати модель у власні сервіси.

Раніше ми повідомляли, що Google додає нові відеоінструменти на базі ШІ до Google Photos і YouTube Shorts.

Читайте також на ProIT, чи може Google Veo 3 стати основою для ігрових світів?

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.