OpenAI офіційно презентувала GPT-5.2 — нове покоління своїх флагманських моделей, яке компанія називає проривом у напрямі «загального інтелекту». Оновлення охоплює три версії: Instant, Thinking і Pro, які вже сьогодні стають доступними для користувачів ChatGPT Plus, Enterprise та Business, а також для розробників через API.
Модель, що перевершила експертів
Ключовим результатом релізу стала продуктивність GPT-5.2 Thinking у бенчмарку GDPval — новому тесті, який оцінює професійні навички у 44 спеціальностях. За підсумками сліпих порівнянь, що проводили галузеві експерти, модель вперше продемонструвала роботу на рівні або вище рівня людини-професіонала.
GPT-5.2 Thinking показала перевагу або паритет з людськими експертами у 70,9% завдань — від створення складних таблиць і презентацій до підготовки технічної документації. При цьому виконання задач відбувалося в 11 разів швидше, а вартість становила менш ніж 1% від роботи фахівця.
Покращення для програмістів
У сфері програмної інженерії GPT-5.2 Thinking встановила нову планку якості: 55,6% у SWE-Bench Pro, одному з найскладніших тестів, що перевіряє роботу з багатомовними кодовими базами та реальними проблемами в репозиторіях.

OpenAI наголошує, що саме ця версія демонструє «найкращі агентні можливості» — моделі стало простіше виконувати складні багатокрокові дії з використанням інструментів.
Суттєво оновлене бачення та менше галюцинацій
GPT-5.2 отримала помітно точніший аналіз візуальної інформації. За даними OpenAI:
- частота помилок при аналізі графіків і технічних схем зменшилася майже вдвічі;
- модель краще розпізнає інтерфейси, дашборди та складні зображення, наприклад компоненти материнських плат;
- кількість галюцинацій у Thinking-версії скоротилася на 30%.
Контекст до 256 000 токенів і точність майже 100%
OpenAI також повідомляє про покращення у «довгостроковому міркуванні» (long-horizon reasoning). У внутрішніх тестах з використанням MRCRv2 GPT-5.2 Thinking: досягла майже 100% точності при пошуку та синтезі інформації у документах обсягом до 256 000 токенів.
Ці можливості орієнтовані передусім на юридичні, фінансові та наукові сфери, де часто працюють з великою кількістю даних.
Партнери вже інтегрують GPT-5.2
Кілька великих платформ — серед них Notion, Zoom, Shopify та Databricks — вже почали впровадження моделі у свої продукти. Вони відзначають «виняткову продуктивність» у агентних сценаріях, де ШІ автономно керує інструментами і виконує комплексні проєкти.
GPT-5.1 поки залишається
Хоча GPT-5.2 уже починає розгортатися, OpenAI не вимикатиме GPT-5.1 негайно: попередня серія залишиться доступною ще як мінімум три місяці.
Читайте також: OpenAI розробила техніку, яка може суттєво змінити підхід до контролю великих мовних моделей (LLM).
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!