ProIT: медіа для профі в IT
2 хв

o3 та o4-mini від OpenAI — найрозумніші ШІ-моделі з автономною логікою

author avatar ProIT NEWS

Компанія OpenAI представила нові ШІ-моделі o3 та o4-mini, які здатні інтегрувати зображення у процес міркування та автономно використовувати інструменти. За словами експертів, це якісний стрибок у розвитку штучного інтелекту.

Як повідомляє Venture Beat, моделі належать до серії «о» і, за твердженням OpenAI, є найрозумнішими та найздатнішими з усіх, що компанія створювала. Вони можуть виконувати завдання, які включають пошук в інтернеті, запуск коду, аналіз файлів, генерацію зображень і тексту в межах одного запиту.

«Деякі моделі справді здаються кроком у майбутнє. GPT-4 був однією з таких. І сьогодні — ще один такий день. Це перші моделі, про які провідні науковці кажуть: вони генерують справді нові, корисні ідеї», — сказав президент OpenAI Грег Брокман під час пресконференції.

«Мислення за допомогою зображень»: новий рівень візуального ШІ

Ключова особливість o3 та o4-mini — здатність не просто бачити зображення, а й використовувати їх у міркуванні. Наприклад, збільшувати деталі, повертати діаграми чи обрізати непотрібне.

На демонстрації дослідник Брендон МакКензі показав, як o3 проаналізувала складний фізичний постер і визначила, що в ньому бракує фінального результату.

«Це виглядало так, ніби модель прочитала десяток наукових статей за кілька секунд. У мене це зайняло б кілька днів, щоб просто дослідити тему, а ще кілька — щоб знайти потрібні матеріали», — зазначив він.

Це новий підхід до роботи з візуальними даними, який, за оцінками аналітиків, може радикально змінити освіту, науку й інженерію.

Моделі як повноцінні ШІ-системи з інтеграцією інструментів

Нові моделі не просто генерують відповіді — вони здатні автономно об’єднувати інструменти у складні ланцюжки дій. Їх навчено через підкріплювальне навчання не лише користуватися інструментами, а й розуміти, коли саме це доцільно.

«Вони використовують інструменти в межах міркування. Наприклад, ми бачили, як o3 зробила понад 600 викликів інструментів під час вирішення складного завдання», — пояснив Брокман.

Такі можливості дають можливість моделі автоматично аналізувати запити, шукати дані, писати код, будувати візуалізації та формувати підсумкові звіти — все в межах однієї безперервної операції.

Нові рекорди в бенчмарках

OpenAI стверджує, що o3 встановлює нові рекорди в тестах Codeforces, SWE-bench та MMMU. Зовнішні експерти відзначають на 20% менше критичних помилок, аніж у попередньої моделі.

o4-mini, менша модель, оптимізована для швидкості та вартості, показала 99,5% на AIME 2025, маючи доступ до Python-інтерпретатора.

Моделі пройшли найбільше на сьогодні тестування OpenAI з безпеки. Зокрема:

заново зібрано датасет для навчання;

додано системні запобіжники для виявлення ризикових запитів;

моделі залишаються нижче критичного рівня ризику в напрямах біологічних, кібер- і самонавчальних загроз.

Моделі вже доступні користувачам ChatGPT Plus, Pro, Team. Клієнти Enterprise й Education отримають доступ уже до кінця місяця. Безкоштовні пакети пропонують можуть спробувати o4-mini, обравши режим Think. API доступне для розробників (з можливістю верифікації для деяких організацій).

Нові моделі поєднують сильне міркування серії «о» з розмовними можливостями GPT-серії та підтримкою інструментів. Це частина стратегії OpenAI з утримання лідерства на фоні конкуренції з Gemini від Google, Claude від Anthropic і xAI Ілона Маска.

Нагадаємо, OpenAI анонсувала нову лінійку моделей GPT-4.1 — до неї входять три варіанти: базовий, mini та nano.

Усі підтримують контекстне вікно до мільйона токенів, що дає можливість працювати з великими обсягами тексту (до 750 тисяч слів). Моделі не доступні в ChatGPT, але їх можна інтегрувати через API.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.