Google продовжує розвивати свої мультимодальні можливості штучного інтелекту, представляючи моделі Veo та Imagen 3 для генерації відео та зображень, які тепер доступні на платформі Vertex AI.
Цей крок дозволяє компаніям інтегрувати найсучасніші інструменти для створення контенту у свої робочі процеси, що відкриває нові можливості, особливо в маркетингу та рекламі. Google стала першою великою компанією, яка пропонує клієнтам модель для генерації відео, повідомляє Venture Beat.
Зараз модель Veo доступна у режимі закритого попереднього перегляду, тоді як Imagen 3 буде доступна для всіх користувачів Vertex AI вже наступного тижня. Imagen 3 також включає інструменти редагування, що дають змогу користувачам покращувати згенеровані зображення відповідно до їхніх потреб.
Що пропонують Veo та Imagen 3?
Модель Veo була вперше представлена на конференції розробників Google I/O. Ця розробка від Google DeepMind є відповіддю на конкурентів, таких як Gen-3 від Runway та Sora від OpenAI. Veo дозволяє створювати високоякісні кінематографічні відео тривалістю понад 60 секунд на основі текстових чи візуальних підказок, забезпечуючи високу узгодженість кадрів.
Imagen 3 — це модель текст-до-зображення, яка створює фотореалістичні зображення з різними стилями. Google заявляє, що Imagen 3 перевершує попередні версії за деталізацією, освітленням і відсутністю артефактів.
Окрім генерації, користувачі зі списку доступу можуть використовувати Imagen 3 для налаштувань, таких як масштабування зображень, inpainting, outpainting і заміна фону. Також є можливість створювати контент, орієнтуючись на референсні зображення та специфічні естетичні вимоги.
Вплив на індустрію
Платформа Vertex AI вже давно є флагманом Google Cloud для розроблення та впровадження застосунків штучного інтелекту. Інтеграція Veo та Imagen 3 розширює можливості платформи, дозволяючи компаніям створювати високоякісний контент швидше та дешевше.
«Клієнти, такі як Agoda, використовують потужність моделей Veo, Gemini та Imagen для оптимізації створення відеореклами, суттєво скорочуючи час на виробництво», — зазначив Воррен Барклі, старший директор з управління продуктами Google. Він також підкреслив наявність інструментів безпеки, таких як цифрові водяні знаки та модерація контенту.
Серед ранніх користувачів нових моделей — Mondelez International (власник Oreo, Cadbury, Milka) та маркетингова компанія WPP. Ці організації вже активно застосовують нові можливості для переосмислення процесів створення та доставлення візуального контенту.
Конкуренція у сфері генеративного штучного інтелекту
Хоча великі провайдери, як Google Cloud, AWS і Microsoft Azure, вже давно пропонують моделі для генерації зображень, моделі для відео — досить рідкісне явище. Запуск Veo змінює це.
Відразу після анонсу Google AWS представила свою модель Nova Reel, яка створює шестисекундні відео студійної якості. Ця модель стане доступною через сервіс Amazon Bedrock для створення генеративних AI-застосунків.
Microsoft поки що відстає в цьому сегменті, проте, ймовірно, змінить ситуацію з виходом на ринок моделі Sora від OpenAI.
Нещодавно ми повідомляли, що група осіб злила доступ до Sora, відеогенератора OpenAI, на знак протесту проти того, що вони називають подвійністю та відмиванням мистецтва з боку компанії.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!