Google оголосила про запуск Project Genie — інструменту, який дозволяє створювати тривимірні віртуальні середовища за допомогою текстових підказок.
На першому етапі Project Genie доступний лише у США для користувачів підписки Google AI Ultra. Вартість тарифу становить $250 на місяць. Він включає підвищені ліміти використання ШІ, 30 ТБ хмарного сховища та пришвидшену версію агентного інструмента програмування Antigravity.
Project Genie побудований на основі Genie 3 — world-model, яку Google представила у серпні. Модель здатна генерувати інтерактивні 3D-середовища на основі інструкцій природною мовою. За даними компанії, віртуальні світи відтворюються з роздільною здатністю 1280×720 пікселів і частотою до 24 кадрів за секунду.
Користувачі можуть взаємодіяти з одним згенерованим середовищем до 60 секунд за сесію. Водночас, як зазначає видання The Register, сама модель Genie 3 технічно підтримує значно довші взаємодії, що вказує на можливе збільшення тривалості сесій у майбутніх оновленнях.
Для створення віртуального світу користувачі вводять дані у два текстові поля: одне описує середовище, інше — аватар, який рухатиметься у просторі. Окрім цього, можна налаштовувати стиль візуалізації та кут огляду камери.
На першому етапі Project Genie створює попередній ескіз світу за допомогою моделі генерації зображень Nano Banana Pro, яку Google випустила у листопаді. Алгоритм здатний перетворювати прості ескізи на фотореалістичні 3D-об’єкти, що робить його придатним для генерації віртуальних середовищ.
Після створення попереднього варіанту користувачі можуть або доопрацьовувати світ за допомогою додаткових інструкцій, або редагувати один із готових шаблонів, що постачаються разом з інструментом. Також доступна функція збереження взаємодії з віртуальним середовищем у форматі відео.
«Ваш світ — це навігаційне середовище, яке чекає на дослідження. Під час руху Project Genie в реальному часі генерує шлях попереду, виходячи з ваших дій. Ви також можете змінювати камеру під час пересування», — написали співробітники Google Дієго Рівас, Сюз Чемберс та Елліотт Бріс у блозі компанії.
У перспективі Google планує запустити Project Genie на міжнародних ринках. З огляду на те, що компанія надає свої AI-моделі через публічну хмару, не виключено, що з часом інструмент стане доступним і для розробників через API. Згенеровані віртуальні середовища можуть використовуватися, зокрема, для створення візуальних навчальних даних у AI-проєктах.
Нгадаємо, Google розширює можливості браузера Chrome, додаючи нові інструменти на базі Gemini. Частина функцій вже доступна користувачам, ще кілька з’являться впродовж наступних місяців.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!