Після п’ятирічної перерви OpenAI представила дві відкриті моделі ШІ — gpt-oss-120b та gpt-oss-20b, орієнтовані на логічне мислення та розв’язання складних задач. Це перші open-weight моделі компанії з часів GPT-2, і тепер їх можна вільно завантажити з платформи Hugging Face, повідомляє TechCrunch.
Моделі створені для розробників і дослідників, які хочуть впроваджувати штучний інтелект у власні проєкти без обмежень. Вони розповсюджуються під ліцензією Apache 2.0, що дозволяє комерційне використання без узгодження з OpenAI. Водночас, навчальні дані залишаються закритими через потенційні юридичні ризики, пов’язані з авторським правом.
Потужність та вимоги до запуску
gpt-oss-120b — найбільша модель з архітектурою Mixture-of-Experts (MoE), має 117 млрд параметрів, з яких активується лише 5,1 млрд на кожен запит, що дозволяє зменшити навантаження. Може працювати на одному GPU NVIDIA H100.
gpt-oss-20b — полегшена версія, яка здатна працювати на ноутбуках з 16 ГБ оперативної пам’яті, що робить її доступною для широкого кола користувачів.
Обидві моделі підтримують лише текстовий інтерфейс — вони не генерують зображення чи аудіо. Втім, завдяки підтримці ланцюгового міркування (chain-of-thought) й можливості викликати сторонні інструменти — як-от вебпошук або виконання коду Python, — вони вже можуть стати основою для створення ШІ-агентів.
Результати у тестах
OpenAI протестувала моделі на популярних бенчмарках.
У Codeforces (завдання з програмування) gpt-oss-120b набрала 2622 бали, gpt-oss-20b — 2516, перевершивши DeepSeek R1, але поступившись власним моделям OpenAI — o3 та o4-mini.

У Humanity’s Last Exam (HLE) моделі отримали 19% і 17,3%, відповідно — результат кращий за більшість відкритих аналогів, проте нижчий за моделі o3.

Водночас моделі демонструють високий рівень галюцинацій — у тесті PersonQA gpt-oss-120b помилялася у 49% відповідей, gpt-oss-20b — у 53%. Це значно більше, ніж у закритої моделі o1 (16%) та навіть у o4-mini (36%).
Раніше OpenAI анонсувала впровадження нової функції в ChatGPT, яка автоматично нагадуватиме користувачам про потребу зробити перерву після тривалого використання сервісу.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!