Команда дослідників штучного інтелекту Meta Platforms Inc. розробила продовження популярної моделі машинного навчання Segment Anything, яка була випущена минулого літа. Про це сказав Марк Цукерберг на заході заході SIGGRAPH 2024, повідомляє Silicon Angle.
За словами Цукерберга, Segment Anything 2 — це значне вдосконалення оригінальної моделі, яка була розроблена для ідентифікації конкретних об’єктів і речей на зображенні.
SA2 є моделлю сегментації, яка є особливим видом моделі комп’ютерного зору, що може дивитися на зображення та описувати те, що бачить. Таким чином, SA2 може ідентифікувати собаку, яка частково закрита деревом, або, наприклад, відро, в яке стікає дощова вода із дірявого даху.
Різниця між SA1 і SA2 полягає в тому, що останній можна застосовувати до відео, а не лише до зображень, що є значним кроком вперед у сфері комп’ютерного зору.
Цукерберг сказав, що вчені часто використовують такі моделі для вивчення таких речей, як коралові рифи та природні середовища проживання.
Той факт, що SA2 може робити це з відео, є свідченням прогресу в індустрії штучного інтелекту, особливо щодо потужності обробки. Лише рік тому застосування сегментації зображення до відео було б неможливим, сказав Цукерберг.
Модель SA2 знаходиться у відкритому доступі. Її можна завантажити з GitHub, а тут доступна безкоштовна демонстрація.
Цукерберг повідомив, що модель була навчена на величезній кількості даних, і компанія випустила анотовану базу даних із приблизно 50 тисячами відео, створених спеціально для навчання SA2.
Модель також навчалася на другій базі даних із понад 100 тисяч відео, але це не оприлюднюється.
Генеральний директор Meta не сказав, чому, але можна припустити, що ці відео, ймовірно, є контентом, створеним користувачами з Facebook та Instagram.
Цифрові близнюки для інфлюенсерів
Під час обговорення Цукерберг також розповів про своє бачення майбутнього, де Facebook та Instagram зможуть генерувати ШІ-двійників інфлюенсерів соціальних мереж і творців контенту.
Він пояснив, що деяким творцям просто не вистачає часу, щоб спілкуватися зі своїми підписниками так, як їм того хочеться.
За його словами Цукерберга, найкраще — це дати людям змогу створити цифрових агентів, навчених на матеріалі, який представляє їх так, як вони хочуть.
Кінцева мета Meta — мати можливість отримувати весь вміст користувача та швидко створювати свого роду бізнес-агента, щоб взаємодіяти з вашими клієнтами, здійснювати продажі та підтримку клієнтів.
Раніше ми повідомляли, що Meta анонсувала останню версію своєї моделі штучного інтелекту Llama, яка отримала назву Llama 3.1.
Найновіша технологія Llama доступна у трьох різних версіях, одна з яких є найбільшою та найпотужнішою моделлю ШІ від Meta на сьогодні.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!