Meta представила найновішу і найпотужнішу ШІ-модель Llama 3.1

Компанія Meta анонсувала останню версію своєї моделі штучного інтелекту Llama, яка отримала назву Llama 3.1.

Найновіша технологія Llama доступна у трьох різних версіях, одна з яких є найбільшою та найпотужнішою моделлю ШІ від Meta на сьогодні, повідомляє CNBC.

Як і попередні версії Llama, найновіша модель має відкритий вихідний код. Це означає, що до неї можна отримати безкоштовний доступ.

Нова велика мовна модель (LLM) підкреслює величезні інвестиції соціальної мережі, спрямовані на те, щоб не відставати від витрат на штучний інтелект, подібних до успішних стартапів OpenAI та Anthropic й інших технологічних гігантів, таких як Google та Amazon.

Оголошення підкреслює і зростання партнерства між Meta та NVIDIA.

NVIDIA є ключовим партнером Meta, який надає материнській компанії Facebook обчислювальні чипи під назвою GPU, що допомагають навчати її моделі ШI, включно з останньою версією Llama.

У той час як такі компанії, як OpenAI, прагнуть заробляти гроші, продаючи доступ до своїх власних LLM або пропонуючи послуги, щоб допомогти клієнтам використовувати цю технологію, Meta не планує розпочинати власний конкурентний корпоративний бізнес, сказав представник Meta під час брифінгу для ЗМІ.

Натомість подібно до того, як Meta випустила Llama 2 минулого літа, компанія співпрацює з кількома технологічними партнерами, які пропонуватимуть своїм клієнтам доступ до Llama 3.1 через відповідні платформи хмарних обчислень, а також продаватимуть інструменти безпеки та керування, які працюють із новим програмним забезпеченням.

Деякі із 25 корпоративних партнерів Meta, пов’язаних із Llama, включають Amazon Web Services, Google Cloud, Microsoft Azure, Databricks і Dell.

Хоча генеральний директор Meta Марк Цукерберг сказав аналітикам, що компанія отримує певний дохід від своїх корпоративних партнерств Llama, представник Meta сказав, що будь-які фінансові вигоди є лише додатковими.

Натомість у Meta вважають, що, інвестуючи в Llama та пов’язані з нею технології штучного інтелекту й надаючи їх у безкоштовний доступ через відкритий вихідний код, вона може залучити висококваліфікованих спеціалістів на конкурентному ринку і знизити загальні витрати на обчислювальну інфраструктуру.

Meta запускає Llama 3.1 напередодні конференції з передової комп’ютерної графіки, на якій Цукерберг і генеральний директор NVIDIA Дженсен Хуанг мають виступити разом.

Гігант соціальних мереж є одним із найпопулярніших клієнтів NVIDIA. Meta потребує найновіших чипів, щоб навчати свої моделі штучного інтелекту. У Meta повідомили, що найбільша версія моделі Llama 3.1 була навчена на 16 тисячах графічних процесорах Nvidia H100.

Для NVIDIA той факт, що Meta навчає моделі з відкритим вихідним кодом, які інші компанії можуть використовувати й адаптувати для свого бізнесу без сплати ліцензійної плати чи запиту дозволу може розширити використання чипів NVIDIA і зберегти високий попит.

Але створення моделей із відкритим кодом може коштувати сотень мільйонів або навіть мільярдів доларів. Існує не так багато компаній, які фінансово здатні розробляти та випускати такі моделі з аналогічними обсягами інвестицій. Google та OpenAI, хоча вони і є клієнтами NVIDIA, зберігають свої найдосконаліші моделі в таємниці.

Meta потребує надійного постачання новітніх графічних процесорів для навчання дедалі потужніших моделей. Як і NVIDIA, компанія намагається розвивати екосистему розробників, які створюють програми штучного інтелекту з відкритим вихідним кодом у центрі, навіть якщо Meta змушена фактично роздавати код і так звані ваги ШІ, створення яких є дорогим.

Підхід із відкритим вихідним кодом приносить користь Meta, відкриваючи розробникам доступ до її внутрішніх інструментів і запрошуючи їх створювати свої на його основі, сказав CNBC Еш Джавері, віцепрезидент компанії з партнерства зі штучним інтелектом.

Цукерберг написав у дописі в блозі у вівторок, що цього тижня він застосував інший підхід до випуску Llama:

«Ми активно будуємо партнерські відносини, щоб якомога більше компаній в екосистемі також могли пропонувати унікальну функціональність своїм клієнтам».

Оскільки Meta не є корпоративним постачальником, вона може направляти компанії, які запитують про Llama, до одного зі своїх корпоративних партнерів, наприклад NVIDIA, сказав Джавері.

Найбільша версія сімейства моделей Llama 3.1 називається Llama 3.1 405B. Цей LLM містить 405 мільярдів параметрів, які стосуються змінних, що визначають загальний розмір моделі та кількість даних, які вона може обробити.

Загалом велика LLM із великою кількістю параметрів може виконувати складніші завдання, ніж менші LLM. Наприклад, розуміння контексту в довгих потоках тексту, вирішення складних математичних рівнянь і навіть генерування синтетичних даних, які, ймовірно, можуть бути використані для покращення менших моделей ШІ.

Meta також випускає менші версії Llama 3.1, які називалися Llama 3.1 8B і Llama 3.1 70B. Вони, по суті, є оновленими версіями своїх попередників і можуть використовуватися для роботи чат-ботів і помічників програмного кодування.

У Meta повідомили, що американські користувачі WhatsApp та відвідувачі вебсайту Meta.AI зможуть побачити можливості Llama 3.1, взаємодіючи з цифровим помічником компанії.

Вказаний цифровий помічник, який працюватиме на останній версії Llama, зможе відповідати на складні математичні завдання або вирішувати проблеми із програмним кодуванням.

Користувачі WhatsApp і Meta.AI, які проживають у США, зможуть перемикатися між новою гігантською Llama 3.1 LLM або менш потужною, але швидшою та меншою версією, щоб отримати відповіді на свої запити, сказав представник компанії.

Читайте також на ProIT: ШІ-генератор мови від Microsoft VALL-E 2 занадто реалістичний і створює забагато ризиків, кажуть дослідники.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!