Google анонсувала PaLM 2: свою останню модель мови штучного інтелекту та конкурента системам, як от GPT-4 від OpenAI. Про це повідомляє The Verge.
«Модель PaLM 2 є сильнішою в логіці та розумінні завдяки широкому навчанню логіки та міркування», — зауважив генеральний директор Google Сундар Пічаї. – «Він також навчений багатомовному тексту, що охоплює понад 100 мов».
«PaLM 2 набагато кращий у ряді текстових завдань, включно із міркуванням, кодуванням та перекладом, — сказав журналістам старший науковий директор Google Слав Петров під час круглого столу перед анонсом моделі на конференції Google I/O, — це значно поліпшено порівняно з PaLM 1 [яка була анонсована у квітні 2022 року]».
Багатомовні можливості PaLM 2 Петров підкреслив, продемонструвавши здатність PaLM 2 розуміти ідіоми різними мовами. Як приклад він навів німецьку фразу «Ich verstehe nur Bahnhof», яка буквально перекладається як: «Я розумію лише залізничну станцію», але означає: «Я не розумію, що ти кажеш» (аналог англійської ідіоми «It’s all Greek to me»).
У дослідницькій статті, яка описує можливості PaLM 2, інженери Google стверджують, що система володіє мовою на рівні, «достатньому для навчання цієї мови», і відзначають, що це частково пов’язано з більшою поширеністю текстів не англійською мовою в навчальних даних.
Як і інші великі мовні моделі, для створення яких потрібна величезна кількість часу та ресурсів, PaLM 2 — це не окремий продукт, а сімейство продуктів — із різними версіями, котрі розгортатимуться як для споживачів, так і для підприємств. Система доступна в чотирьох розмірах: Gecko, Otter, Bison і Unicorn, від найменшого до найбільшого, і налаштована на даних, що стосуються домену, для виконання певних завдань для корпоративних клієнтів.
Існує версія PaLM, навчена на даних про стан здоров’я (Med-PaLM 2), яка, за словами Google, може на «експертному» рівні відповідати на запитання, подібні до тих, що містяться в Іспиті з медичного ліцензування США. Інша версія навчена на даних кібербезпеки (Sec-PaLM 2). ) і може «пояснити поведінку потенційно шкідливих сценаріїв та допомогти виявити загрози в коді», — сказав Петров. Обидві ці моделі будуть доступні через Google Cloud, спершу для обраних клієнтів.
У власному домені Google PaLM 2 уже використовується для роботи 25 функцій і продуктів, включно із Bard, експериментальним чат-ботом компанії. Оновлення, доступні через Bard, включають покращені можливості кодування та більшу підтримку мов. Він також використовується для роботи функцій у програмах Google Workspace, як-от Документи, Презентації та Таблиці.
Слід зауважити, що за інформацією від Google, найлегша версія PaLM 2, Gecko, досить мала, аби працювати на мобільних телефонах, обробляючи 20 токенів за секунду, що еквівалентно приблизно 16-17 словам. Google не повідомив, яке апаратне забезпечення було використано для тестування цієї моделі, сказав лише, що воно працювало «на останніх телефонах». Однак мініатюризація таких мовних моделей є суттєвою. Подібні системи задорогі для роботи в хмарі й можливість використовувати їх локально матиме інші переваги, наприклад покращену конфіденційність. Проблема полягає в тому, що менші версії мовних моделей неминуче менш ефективні, ніж їхні більші брати.
За допомогою PaLM 2 Google сподівається закрити «прірву штучного інтелекту» між компанією та такими конкурентами, як Microsoft, котра агресивно просуває мовні інструменти штучного інтелекту у свій пакет програмного забезпечення Office. Тепер Microsoft пропонує функції штучного інтелекту, які допомагають узагальнювати документи, писати електронні листи, створювати слайди для презентацій тощо.