OpenAI працює над новою технологією під кодовою назвою Strawberry

Розробник ChatGPT OpenAI працює над новим підходом до своїх моделей штучного інтелекту у проєкті під кодовою назвою Strawberry. Про це повідомляє Reuters.

Наскільки близька Strawberry до того, щоб стати загальнодоступною, поки що невідомо. Також у таємниці зберігається інформація про те, як вона працює.

Серед цілей проєкту є надання можливостей моделям ШІ автономно переглядати Інтернет, щоб заздалегідь планувати більш складні завдання.

Відповідаючи на запитання про Strawberry, представник компанії OpenAI заявив:

«Ми хочемо, щоб наші моделі ШІ бачили та розуміли світ, як ми. Постійне дослідження нових можливостей штучного інтелекту є звичайною практикою в галузі. Ми переконані, що з часом ці системи будуть покращувати міркування».

Раніше проєкт носив назву Q*. Його демоверсії на початку цього року показали, що він може відповісти на складні наукові та математичні запитання, повідомляє Reuters із посиланням на неназвані джерела, які були свідками демонстрацій.

Своєю чергою Bloomberg повідомив, що нещодавно на внутрішній загальній зустрічі OpenAI показала демонстрацію дослідницького проєкту, який має навички міркування, схожі на людські.

В OpenAI сподіваються, що нововведення значно покращить можливості аргументації моделей ШІ. Сам же проєкт Strawberry передбачає спеціальний спосіб обробки моделі штучного інтелекту після її попереднього навчання на дуже великих наборах даних.

Дослідники, опитані Reuters, кажуть, що міркування є ключовим фактором для досягнення ШІ людського або надлюдського рівня інтелекту.

Хоча великі мовні моделі вже можуть узагальнювати тексти та складати елегантну прозу набагато швидше, ніж будь-яка людина, ця технологія часто не справляється із проблемами, вирішення яких для людей є інтуїтивно зрозумілим, як-от розпізнавання логічних помилок і гра у хрестики-нулики. Коли модель стикається з такими проблемами, вона часто «галюцинує» і видає неправдиву інформацію.

Дослідники штучного інтелекту, опитані фахівцями видання, загалом погоджуються, що міркування в контексті ШІ передбачає формування моделі, яка дозволяє штучному інтелекту планувати наперед, відображати, як функціонує фізичний світ, і вирішувати складні багатоетапні проблеми.

Вдосконалення міркувань у моделях штучного інтелекту розглядається як ключ до розблокування здатності моделей робити все: від великих наукових відкриттів до планування і створення нових програмних застосунків.

Інші компанії, такі як Google, Meta та Microsoft, також експериментують із різними методами для покращення міркувань у моделях ШІ, як і більшість академічних лабораторій, які проводять дослідження штучного інтелекту.

Однак дослідники розходяться в думках щодо того, чи здатні великі мовні моделі (LLM) включати ідеї та довгострокове планування у технологію прогнозування. Наприклад, один із піонерів сучасного штучного інтелекту Янн ЛеКун, який працює в Meta, часто говорив, що LLM не здатні міркувати як людина.

Виклики ШІ

Strawberry є ключовим компонентом плану OpenAI щодо подолання цих проблем, повідомило джерело, знайоме із вказаним питанням.

У документі описано, що Strawberry прагне зробити, але не сказано, як саме. В останні місяці компанія у приватному порядку сигналізувала розробникам і партнерам, що перебуває на порозі випуску технології з більш розширеними можливостями.

Strawberry включає спеціалізований спосіб так званого постнавчання генеративних моделей штучного інтелекту OpenAI або адаптації базових моделей для вдосконалення їхньої продуктивності після того, як вони вже навчалися на масивах узагальнених даних.

Етап розроблення моделі після навчання включає такі методи, як «Точне налаштування». Це процес, який використовується майже в усіх мовних моделях і має багато варіантів. Наприклад, коли люди дають зворотний зв’язок моделі на основі її відповідей і подають їй приклади хороших і поганих відповідей.

Проєкт Strawberry схожий на метод, розроблений у Стенфорді у 2022 році під назвою Self-Taught Reasoner (STaR), повідомило поінформоване джерело.

STaR дозволяє моделям штучного інтелекту «завантажувати» себе на вищі рівні інтелекту шляхом ітеративного створення власних навчальних даних. Теоретично це можна використовувати для того, щоб мовні моделі виходили за межі людського рівня інтелекту, сказав Reuters один із його творців, професор Стенфордського університету Ноа Гудман.

«Я вважаю, що це водночас захопливо і жахливо. Якщо все буде продовжуватись у цьому напрямі, то нам, як людям, є про що серйозно замислитись», — зауважив Гудман.

Він не пов’язаний з OpenAI і не знайомий із роботою Strawberry.

OpenAI орієнтує Strawberry на виконання довгострокових завдань (LHT) — складних завдань, які вимагають від моделі планувати наперед і виконувати серію дій протягом тривалого періоду часу. Для цього OpenAI створює, навчає та оцінює моделі на основі того, що компанія називає набором даних глибокого дослідження.

У компанії хочуть, щоб їхні моделі використовували ці можливості для проведення досліджень шляхом автономного перегляду вебсторінок за допомогою CUA або агента, який використовує комп’ютер, що може виконувати дії на основі власних висновків.

Читайте також на ProIT: OpenAI зіткнулася із двома серйозними проблемами безпеки.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!