Google DeepMind оголосив, що вдосконалена версія його штучного інтелекту Gemini, відома як Gemini Deep Think, стала першою в історії ШІ-системою, яка отримала золоту медаль на Міжнародній математичній олімпіаді (IMO). Про це повідомляє Venture Beat.
Модель успішно розв’язала п’ять із шести надскладних математичних задач і набрала 35 із 42 можливих балів. Це вище за офіційний поріг для золота.
Міжнародна математична олімпіада — престижне щорічне змагання для учнів шкіл, яке проходить з 1959 року. У ньому беруть участь команди із понад 100 країн, кожна з яких складається із шести найсильніших молодих математиків.
Учасники мають 4,5 години, щоб розв’язати шість задач з алгебри, геометрії, комбінаторики й теорії чисел. Лише приблизно 8% учасників здобувають золото, тож планка надзвичайно висока.
Уперше в історії до цього рівня наблизилася не людина, а штучний інтелект.
Gemini Deep Think: як працює система
На відміну від попередніх AI-рішень, які потребували перекладу умов задач на спеціалізовані мови програмування, Gemini Deep Think працював повністю у природній мові, зчитуючи оригінальні формулювання задач і видаючи суворі математичні доведення.
Особливість цієї системи — новий підхід до логіки «паралельне мислення». Замість того, щоб слідувати одному логічному ланцюжку, модель одночасно аналізує кілька варіантів розв’язку і лише потім обирає найкращий. Це дає можливість досягати більш елегантних і точних результатів, ніж ті, що зазвичай демонструють інші AI-моделі.
Одна із задач, як зазначив дослідник DeepMind Чжунхьок Чжон, вимагала знань на рівні вищої математики, яку використовували більшість учасників-людей. Але Gemini натомість зробив нестандартне спостереження і застосував лише елементарну теорію чисел, створивши самодостатнє і точне доведення.
Успіх Gemini Deep Think став можливим завдяки:
• поглибленому навчанню з використанням даних із доведення теорем, багатокрокової логіки й аналізу IMO-стилю;
• застосуванню методів підкріплення (reinforcement learning) для оптимізації мислення;
• спеціально підібраній добірці якісних математичних рішень;
• цільовому навчальному фреймворку для розв’язання задач олімпіадного рівня.
Оголошення DeepMind з’явилося після офіційного підтвердження результатів від журі IMO. Важливо, що компанія дочекалася формальної верифікації, відмовившись від передчасних заяв, щоб не затьмарити досягнення самих учнів.
Порівняння з минулим роком
Ще у 2024 році системи AlphaProof та AlphaGeometry, які об’єднували мовні моделі з математичними інструментами, змогли лише досягти рівня срібної медалі, розв’язавши чотири задачі із шести. Проте вони потребували попереднього втручання людини. Експерти вручну перекладали задачі у код, і лише потім AI будував рішення.
Цьогорічний підхід радикально відрізняється — весь процес від постановки задачі до доведення відбувався в natural language, без «костилів».
Що далі?
Gemini Deep Think поки не зміг вирішити одну задачу із шести, як і більшість учасників. Її подолали лише п’ятеро школярів з усього світу, тож навіть AI визнає: підлітки ще мають фору.
Google DeepMind планує повернутися на IMO наступного року вже з метою здобути максимальний бал. Модель також буде доступна для тестування професійними математиками, а пізніше — у форматі передплати Google AI Ultra ($250 на місяць), яка дає доступ до найпотужніших моделей компанії.
Чому це важливо
▪️ Зміна парадигми. Штучний інтелект навчився розв’язувати задачі не шляхом автоматизації, а шляхом осмислення, як це робить людина.
▪️ Бізнес-наслідки. Якщо ШІ може вирішувати олімпіадні задачі з нуля, то незабаром зможе розв’язувати аналітичні задачі в реальному житті (від фінансів до фарми).
▪️ Демократизація глибокої аналітики. Більше не потрібно бути математиком або програмістом, щоб користуватися можливостями рівня IMO.
Читайте також на ProIT: Google DeepMind презентувала локальну ШІ-модель Gemini Robotics On-Device для автономних роботів.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!