o3 та o4-mini від OpenAI — найрозумніші ШІ-моделі з автономною логікою

Компанія OpenAI представила нові ШІ-моделі o3 та o4-mini, які здатні інтегрувати зображення у процес міркування та автономно використовувати інструменти. За словами експертів, це якісний стрибок у розвитку штучного інтелекту.

Як повідомляє Venture Beat, моделі належать до серії «о» і, за твердженням OpenAI, є найрозумнішими та найздатнішими з усіх, що компанія створювала. Вони можуть виконувати завдання, які передбачають пошук в інтернеті, запуск коду, аналіз файлів, генерацію зображень і тексту в межах одного запиту.

«Деякі моделі справді здаються кроком у майбутнє. GPT-4 була однією з таких. І сьогодні — ще один такий день. Це перші моделі, про які провідні науковці кажуть: вони генерують справді нові, корисні ідеї», — зазначив президент OpenAI Грег Брокман під час пресконференції.

Мислення за допомогою зображень: новий рівень візуального ШІ

Особливістю o3 та o4-mini є здатність не просто бачити зображення, а й використовувати їх у міркуванні. Наприклад, збільшувати деталі, повертати діаграми чи обрізати непотрібне.

На демонстрації дослідник Брендон МакКензі показав, як o3 проаналізувала складний фізичний постер і визначила, що в ньому бракує фінального результату.

«Це виглядало так, ніби модель прочитала десяток наукових статей за кілька секунд. У мене це зайняло б кілька днів, щоб просто дослідити тему, а ще кілька — щоб знайти потрібні матеріали», — зазначив він.

Це новий підхід до роботи з візуальними даними, який, за оцінками аналітиків, може радикально змінити освіту, науку й інженерію.

Моделі як повноцінні ШІ-системи з інтеграцією інструментів

Нові моделі не просто генерують відповіді — вони здатні автономно об’єднувати інструменти у складні ланцюжки дій. Їх навчено через підкріплювальне навчання не лише користуватися інструментами, а й розуміти, коли саме це доцільно.

«Вони використовують інструменти в межах міркування. Наприклад, ми бачили, як o3 зробила понад 600 викликів інструментів під час вирішення складного завдання», — пояснив Брокман.

Такі можливості дають змогу моделі автоматично аналізувати запити, шукати дані, писати код, будувати візуалізації та формувати підсумкові звіти — все в межах однієї безперервної операції.

Нові рекорди в бенчмарках

OpenAI стверджує, що o3 встановлює нові рекорди в тестах Codeforces, SWE-bench і MMMU. Зовнішні експерти відзначають на 20% менше критичних помилок, аніж у попередньої моделі.

o4-mini, менша модель, оптимізована для швидкості та вартості, показала 99,5% на AIME 2025, маючи доступ до Python-інтерпретатора.

Моделі пройшли найбільше на сьогодні тестування OpenAI з безпеки. Зокрема:

• було заново зібрано датасет для навчання;

• додано системні запобіжники для виявлення ризикових запитів;

• моделі залишаються нижче критичного рівня ризику в напрямах біологічних, кібер- і самонавчальних загроз.

Моделі вже доступні користувачам ChatGPT Plus, Pro, Team. Клієнти Enterprise й Education отримають доступ уже до кінця місяця. Безкоштовні пакети можуть спробувати o4-mini, обравши режим Think. API доступне для розробників із можливістю верифікації для деяких організацій.

Нові моделі поєднують міркування серії «о» з розмовними можливостями GPT-серії та підтримкою інструментів. Це частина стратегії OpenAI з утримання лідерства на тлі конкуренції з Gemini від Google, Claude від Anthropic і xAI Ілона Маска.

Нагадаємо, нещодавно OpenAI анонсувала нову лінійку моделей GPT-4.1.

Вони підтримують контекстне вікно до мільйона токенів, що дає можливість працювати з великими обсягами тексту (до 750 тисяч слів). Моделі не доступні в ChatGPT, але їх можна інтегрувати через API.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!