Сервіс генерації зображень на основі штучного інтелекту Midjourney представив свою першу нову модель за більш ніж рік. Midjourney V7 — це повністю оновлена архітектура, яка вже доступна користувачам у відкритій альфа-версії, повідомляє Ars Technica.
Розробники зазначають два основні напрями покращень у версії V7:
• якість зображень;
• нові інструменти й сценарії використання (workflows).
Краща генерація рук, текстур і матеріалів
Модель V7 значно покращує узгодженість і точність генерації таких складних елементів, як руки, пальці, частини тіла та різноманітні об’єкти. Крім того, вона створює набагато реалістичніші текстури. Наприклад, зморшки на шкірі або делікатні переходи кольору в кераміці.
Ці деталі зазвичай легко видають ШІ-згенеровані зображення. Midjourney не стверджує, що навчила модель створювати зображення, які не відрізнити від реальних для фахівців. Але вказує на суттєве зменшення типових візуальних артефактів, з якими користувачі зіткнулися в попередніх версіях.
Також V7 здатна передавати матеріали й освітлення, які попередня версія V6.1 не могла відтворити у належний спосіб.
Новий режим Draft: швидко й дешево, але знижена якість
Серед функціональних оновлень найбільш помітною є поява Draft Mode. За словами розробників, цей режим:
• генерує зображення в 10 разів швидше, ніж звичайний;
• використовує вдвічі менше кредитів.
Але в цьому режимі якість зображень нижча, тож він не призначений для фінального рендеру, а радше для експериментів, пошуку ідей і швидкої ітерації. Після цього можна перемкнутись у повноцінний режим і згенерувати остаточний результат.
Режими Turbo і Relax
Модель V7 зараз підтримує лише такі рендер-режими:
• Turbo — швидкий фінальний рендер, але з подвоєним споживанням кредитів.
• Relax — повільний, але економніший.
Звичний standard mode для V7 поки недоступний. Команда Midjourney пояснила, що працює над його доопрацюванням і планує додати його пізніше.
Підтримка старих параметрів і персоналізація за замовчуванням
V7 сумісна з більшістю параметрів попередніх версій, включно з:
• --ar
(співвідношення сторін);
• --seed
(початкове значення випадковості);
• --sref
(референси стилю з версії 6.1).
Головна зміна — персоналізація тепер увімкнена за замовчуванням. Це означає, що кожен користувач має пройти налаштування, вибираючи між сотнями пар зображень, щоб система могла навчитися, яку естетику користувач вважає красивою.
Після цього модель адаптує свої генерації відповідно до цих уподобань. Якщо є бажання, персоналізацію можна вимкнути, як і в попередніх версіях.
Midjourney була однією з перших систем генерації зображень, що набула широкого вжитку. Спочатку вона працювала лише через Discord і вимагала знання специфічного синтаксису. Зараз компанія вже пропонує сучасний вебінтерфейс.
Велика частина AI-зображень у соцмережах була створена саме в Midjourney. Також сервіс став ключовою частиною пайплайну для ШІ-відео, коли початкові кадри генерують за допомогою сервісу, а потім анімовану версію створюють за допомогою Runway та подібних інструментів.
Попри популярність, Midjourney залишається в центрі юридичних суперечок. Проти неї подано кілька позовів, пов’язаних із використанням авторських зображень для тренування моделі. Серед доказів — випадкове генерування водяних знаків чи підписів художників.
Нещодавно компанія також анонсувала плани випустити власне апаратне забезпечення, однак жодних деталей поки що не оприлюднено.
Читайте на ProIT: Штучний інтелект для дизайнерів: топ-8 корисних інструментів для роботи.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!