Компанія OpenAI представила нові ШІ-моделі o3 та o4-mini, які здатні інтегрувати зображення у процес міркування та автономно використовувати інструменти. За словами експертів, це якісний стрибок у розвитку штучного інтелекту.
Як повідомляє Venture Beat, моделі належать до серії «о» і, за твердженням OpenAI, є найрозумнішими та найздатнішими з усіх, що компанія створювала. Вони можуть виконувати завдання, які включають пошук в інтернеті, запуск коду, аналіз файлів, генерацію зображень і тексту в межах одного запиту.
«Деякі моделі справді здаються кроком у майбутнє. GPT-4 був однією з таких. І сьогодні — ще один такий день. Це перші моделі, про які провідні науковці кажуть: вони генерують справді нові, корисні ідеї», — сказав президент OpenAI Грег Брокман під час пресконференції.
«Мислення за допомогою зображень»: новий рівень візуального ШІ
Ключова особливість o3 та o4-mini — здатність не просто бачити зображення, а й використовувати їх у міркуванні. Наприклад, збільшувати деталі, повертати діаграми чи обрізати непотрібне.
На демонстрації дослідник Брендон МакКензі показав, як o3 проаналізувала складний фізичний постер і визначила, що в ньому бракує фінального результату.
«Це виглядало так, ніби модель прочитала десяток наукових статей за кілька секунд. У мене це зайняло б кілька днів, щоб просто дослідити тему, а ще кілька — щоб знайти потрібні матеріали», — зазначив він.
Це новий підхід до роботи з візуальними даними, який, за оцінками аналітиків, може радикально змінити освіту, науку й інженерію.
Моделі як повноцінні ШІ-системи з інтеграцією інструментів
Нові моделі не просто генерують відповіді — вони здатні автономно об’єднувати інструменти у складні ланцюжки дій. Їх навчено через підкріплювальне навчання не лише користуватися інструментами, а й розуміти, коли саме це доцільно.
«Вони використовують інструменти в межах міркування. Наприклад, ми бачили, як o3 зробила понад 600 викликів інструментів під час вирішення складного завдання», — пояснив Брокман.
Такі можливості дають можливість моделі автоматично аналізувати запити, шукати дані, писати код, будувати візуалізації та формувати підсумкові звіти — все в межах однієї безперервної операції.
Нові рекорди в бенчмарках
OpenAI стверджує, що o3 встановлює нові рекорди в тестах Codeforces, SWE-bench та MMMU. Зовнішні експерти відзначають на 20% менше критичних помилок, аніж у попередньої моделі.
o4-mini, менша модель, оптимізована для швидкості та вартості, показала 99,5% на AIME 2025, маючи доступ до Python-інтерпретатора.
Моделі пройшли найбільше на сьогодні тестування OpenAI з безпеки. Зокрема:
• заново зібрано датасет для навчання;
• додано системні запобіжники для виявлення ризикових запитів;
• моделі залишаються нижче критичного рівня ризику в напрямах біологічних, кібер- і самонавчальних загроз.
Моделі вже доступні користувачам ChatGPT Plus, Pro, Team. Клієнти Enterprise й Education отримають доступ уже до кінця місяця. Безкоштовні пакети пропонують можуть спробувати o4-mini, обравши режим Think. API доступне для розробників (з можливістю верифікації для деяких організацій).
Нові моделі поєднують сильне міркування серії «о» з розмовними можливостями GPT-серії та підтримкою інструментів. Це частина стратегії OpenAI з утримання лідерства на фоні конкуренції з Gemini від Google, Claude від Anthropic і xAI Ілона Маска.
Нагадаємо, OpenAI анонсувала нову лінійку моделей GPT-4.1 — до неї входять три варіанти: базовий, mini та nano.
Усі підтримують контекстне вікно до мільйона токенів, що дає можливість працювати з великими обсягами тексту (до 750 тисяч слів). Моделі не доступні в ChatGPT, але їх можна інтегрувати через API.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!