ProIT: медіа для профі в IT
2 хв

GPT-5.2 вже тут: прорив у довгому контексті, коді й агентних можливостях

author avatar ProIT NEWS

OpenAI офіційно презентувала GPT-5.2 — нове покоління своїх флагманських моделей, яке компанія називає проривом у напрямі «загального інтелекту». Оновлення охоплює три версії: Instant, Thinking і Pro, які вже сьогодні стають доступними для користувачів ChatGPT Plus, Enterprise та Business, а також для розробників через API.

Модель, що перевершила експертів

Ключовим результатом релізу стала продуктивність GPT-5.2 Thinking у бенчмарку GDPval — новому тесті, який оцінює професійні навички у 44 спеціальностях. За підсумками сліпих порівнянь, що проводили галузеві експерти, модель вперше продемонструвала роботу на рівні або вище рівня людини-професіонала.

GPT-5.2 Thinking показала перевагу або паритет з людськими експертами у 70,9% завдань — від створення складних таблиць і презентацій до підготовки технічної документації. При цьому виконання задач відбувалося в 11 разів швидше, а вартість становила менш ніж 1% від роботи фахівця.

Покращення для програмістів

У сфері програмної інженерії GPT-5.2 Thinking встановила нову планку якості: 55,6% у SWE-Bench Pro, одному з найскладніших тестів, що перевіряє роботу з багатомовними кодовими базами та реальними проблемами в репозиторіях.

OpenAI наголошує, що саме ця версія демонструє «найкращі агентні можливості» — моделі стало простіше виконувати складні багатокрокові дії з використанням інструментів.

Суттєво оновлене бачення та менше галюцинацій

GPT-5.2 отримала помітно точніший аналіз візуальної інформації. За даними OpenAI:

  • частота помилок при аналізі графіків і технічних схем зменшилася майже вдвічі;
  • модель краще розпізнає інтерфейси, дашборди та складні зображення, наприклад компоненти материнських плат;
  • кількість галюцинацій у Thinking-версії скоротилася на 30%.

Контекст до 256 000 токенів і точність майже 100%

OpenAI також повідомляє про покращення у «довгостроковому міркуванні» (long-horizon reasoning). У внутрішніх тестах з використанням MRCRv2 GPT-5.2 Thinking: досягла майже 100% точності при пошуку та синтезі інформації у документах обсягом до 256 000 токенів.

Ці можливості орієнтовані передусім на юридичні, фінансові та наукові сфери, де часто працюють з великою кількістю даних.

Партнери вже інтегрують GPT-5.2

Кілька великих платформ — серед них Notion, Zoom, Shopify та Databricks — вже почали впровадження моделі у свої продукти. Вони відзначають «виняткову продуктивність» у агентних сценаріях, де ШІ автономно керує інструментами і виконує комплексні проєкти.

GPT-5.1 поки залишається

Хоча GPT-5.2 уже починає розгортатися, OpenAI не вимикатиме GPT-5.1 негайно: попередня серія залишиться доступною ще як мінімум три місяці.

Читайте також: OpenAI розробила техніку, яка може суттєво змінити підхід до контролю великих мовних моделей (LLM).

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.