OpenAI випустила перші відкриті ШІ-моделі за 5 років: що вміють gpt-oss-120b і 20b

Після п’ятирічної перерви OpenAI представила дві відкриті моделі ШІ — gpt-oss-120b та gpt-oss-20b, орієнтовані на логічне мислення та розв’язання складних задач. Це перші open-weight моделі компанії з часів GPT-2, і тепер їх можна вільно завантажити з платформи Hugging Face, повідомляє TechCrunch.

Моделі створені для розробників і дослідників, які хочуть впроваджувати штучний інтелект у власні проєкти без обмежень. Вони розповсюджуються під ліцензією Apache 2.0, що дозволяє комерційне використання без узгодження з OpenAI. Водночас, навчальні дані залишаються закритими через потенційні юридичні ризики, пов’язані з авторським правом.

Потужність та вимоги до запуску

gpt-oss-120b — найбільша модель з архітектурою Mixture-of-Experts (MoE), має 117 млрд параметрів, з яких активується лише 5,1 млрд на кожен запит, що дозволяє зменшити навантаження. Може працювати на одному GPU NVIDIA H100.

gpt-oss-20b — полегшена версія, яка здатна працювати на ноутбуках з 16 ГБ оперативної пам’яті, що робить її доступною для широкого кола користувачів.

Обидві моделі підтримують лише текстовий інтерфейс — вони не генерують зображення чи аудіо. Втім, завдяки підтримці ланцюгового міркування (chain-of-thought) й можливості викликати сторонні інструменти — як-от вебпошук або виконання коду Python, — вони вже можуть стати основою для створення ШІ-агентів.

Результати у тестах

OpenAI протестувала моделі на популярних бенчмарках.

У Codeforces (завдання з програмування) gpt-oss-120b набрала 2622 бали, gpt-oss-20b — 2516, перевершивши DeepSeek R1, але поступившись власним моделям OpenAI — o3 та o4-mini.

У Humanity’s Last Exam (HLE) моделі отримали 19% і 17,3%, відповідно — результат кращий за більшість відкритих аналогів, проте нижчий за моделі o3.

Водночас моделі демонструють високий рівень галюцинацій — у тесті PersonQA gpt-oss-120b помилялася у 49% відповідей, gpt-oss-20b — у 53%. Це значно більше, ніж у закритої моделі o1 (16%) та навіть у o4-mini (36%).

Раніше OpenAI анонсувала впровадження нової функції в ChatGPT, яка автоматично нагадуватиме користувачам про потребу зробити перерву після тривалого використання сервісу.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!