OpenAI випускає o1 — свою першу модель зі здатністю до міркування

Компанія OpenAI випускає нову модель під назвою o1 — першу в серії моделей міркування, які навчені відповідати на складніші запитання швидше, ніж це може зробити людина.

Разом із o1 також виходить o1-mini, менша та дешевша версія, повідомляє The Verge. І так, якщо ви чули чутки про модель Strawberry, то це саме вона.

Для OpenAI o1 є кроком до її ширшої мети — створення штучного інтелекту, схожого на людський.

На практиці ця модель краще пише код і вирішує багатокрокові завдання порівняно із попередніми моделями. Однак вона є дорожчою і повільнішою у використанні, ніж GPT-4o. Випуск o1 названо попереднім переглядом, щоб підкреслити його початковий стан.

Користувачі ChatGPT Plus і Team отримають доступ до обох моделей (o1-preview та o1-mini) відразу, а користувачі Enterprise та Edu — наступного тижня.

OpenAI планує відкрити доступ до o1-mini для всіх безкоштовних користувачів ChatGPT, але дата ще не визначена.

Розробникам модель коштує дуже дорого: в API o1-preview обійдеться у $15 за мільйон вхідних токенів і $60 за мільйон вихідних токенів. Для порівняння, GPT-4o коштує $5 за мільйон вхідних токенів і $15 за мільйон вихідних.

За словами керівника досліджень OpenAI Джеррі Творека, навчання o1 принципово відрізняється від попередників. Модель тренували за допомогою нових алгоритмів оптимізації та нового набору даних, спеціально підібраного для неї.

Компанія навчала попередні моделі GPT імітувати шаблони з їхніх тренувальних даних. У випадку з o1 модель навчали вирішувати проблеми самостійно за допомогою техніки, відомої як навчання з підкріпленням, яка навчає систему через винагороди та покарання. Потім модель використовує ланцюг міркувань для обробки запитів, подібно до того, як люди вирішують проблеми, проходячи їх крок за кроком.

У результаті цієї нової методології навчання OpenAI стверджує, що модель стала точнішою.

«Ми помітили, що ця модель менше галюцинує, проте проблема все ще залишається. Ми не можемо сказати, що вирішили проблему галюцинацій», — зазначив Творек.

Основна відмінність цієї нової моделі від GPT-4o полягає в її здатності вирішувати складні завдання, такі як програмування та математика, набагато краще, ніж її попередники, одночасно пояснюючи свої міркування.

«Модель точно краще вирішує тест із математики AP, ніж я, а я вивчав математику як другий предмет у коледжі», — зауважив головний науковий співробітник OpenAI Боб Макгру.

Він додав, що модель o1 була протестована на кваліфікаційному іспиті для Міжнародної математичної олімпіади. Якщо GPT-4o правильно вирішила лише 13% завдань, то o1 дала правильну відповідь у 83% випадків.

На онлайн-програмувальних конкурсах, відомих як змагання Codeforces, нова модель досягла 89-го перцентиля серед учасників. В OpenAI стверджують, що наступне оновлення цієї моделі покаже результати, подібні до тих, що демонструють аспіранти на складних тестах із фізики, хімії та біології.

Водночас o1 не настільки ефективна, як GPT-4o, у багатьох інших сферах. Вона не так добре обізнана про світ. Крім того, не має доступу до вебресурсів і не може обробляти файли та зображення.

Проте компанія вважає, що ця модель представляє новий клас можливостей. Вона отримала назву o1, що означає «перезавантаження до версії 1».

OpenAI не вірить в ототожнення мислення моделей ШІ з мисленням людини. Однак інтерфейс призначений для того, щоб показати, як модель витрачає більше часу на обробку запитів і глибше занурюється у вирішення проблем.

Що далі?

Великі мовні моделі сьогодні ще не дуже розумні. Вони по суті просто передбачають послідовності слів, щоб дати відповідь, ґрунтуючись на шаблонах, вивчених із великих обсягів даних.

Наприклад, ChatGPT часто неправильно стверджує, що слово «Strawberry» має лише дві літери r, оскільки модель неправильно розбиває це слово. На щастя, нова модель o1 дала правильну відповідь на цей запит.

Як повідомляється, OpenAI прагне залучити більше фінансування при вражаючій оцінці у $150 мільярдів. Її розвиток залежить від нових проривів у дослідженнях.

Компанія додає здатність до міркувань у великі мовні моделі, оскільки бачить майбутнє за автономними системами, здатними ухвалювати рішення та виконувати дії від імені користувача.

Для дослідників ШІ вирішення проблеми міркувань є важливим наступним кроком до інтелекту рівня людини.

Ідея полягає в тому, що якщо модель здатна на більше, ніж просто розпізнавання шаблонів, це може відкрити прориви в таких галузях, як медицина та інженерія. Поки що здатності до міркувань в o1 відносно повільні, вони не схожі на агентів і є дорогими для розробників.

«Ми вже багато місяців працюємо над міркуванням, тому що вважаємо це справжнім критичним проривом. Фундаментально це новий підхід для моделей, який дає змогу вирішувати надскладні завдання, необхідні для досягнення інтелекту, подібного до людського»,— зазначив Макгру.

Нагадаємо, компанія OpenAI повідомила, що ChatGPT перевищив позначку у 200 мільйонів активних користувачів щотижня. Очікується, що Apple допоможе цьому числу ще більше зрости з випуском iOS 18.

На заході Apple, It’s Glowtime представники компанії розповіли, що iOS 18 вийде вже у понеділок, 16 вересня.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!