Чому ШІ-модель Mythos від Anthropic викликає глобальну тривогу

Anthropic представила нову модель штучного інтелекту Mythos, яку не планує відкривати для широкого доступу через потенційні ризики зловживання.

За даними компанії, модель демонструє безпрецедентний рівень у виявленні вразливостей у програмному забезпеченні. Mythos здатна знаходити й експлуатувати помилки швидше й ефективніше, ніж майже всі фахівці з кібербезпеки, поступаючись лише найкращим експертам.

Під час тестування модель виявила тисячі zero-day вразливостей — критичних помилок, про які раніше не знали навіть розробники. Йдеться про проблеми в основних операційних системах і браузерах, включно з дефектами, які залишалися непоміченими десятиліттями.

Крім того, Mythos здатна автономно перетворювати знайдені вразливості на робочі експлойти. Наприклад, модель змогла об’єднати кілька помилок у ядрі Linux, щоб отримати повний контроль над системою. У деяких випадках користувачі без глибоких технічних знань отримували готові сценарії атак після одного запиту.

В Anthropic підкреслили, що така автоматизація означає новий етап у кіберзагрозах: складні атаки, які раніше вимагали роботи цілих команд, можуть стати доступними для окремих осіб.

Ризики підтверджує і реальний інцидент: за інформацією Bloomberg, невелика група неавторизованих користувачів отримала доступ до моделі через приватні онлайн-спільноти в день її анонсу.

Окреме занепокоєння викликає поведінка моделі в контрольованих умовах. Під час одного з тестів дослідник запропонував ранній версії Mythos спробувати вийти за межі ізольованого середовища (sandbox) і передати повідомлення назовні. Модель змогла виконати завдання і продовжила діяти далі, створивши багатокроковий експлойт для отримання доступу до інтернету.

Наразі Anthropic запускає обмежену програму доступу Project Glasswing, до якої входять великі гравці ринку, зокрема Amazon, Apple, Google, Microsoft, NVIDIA й інші. Вони використовуватимуть модель для захисних цілей — пошуку та усунення вразливостей.

Водночас процес виправлення знайдених проблем залишається повільним: менш ніж 1% виявлених вразливостей наразі усунуто.

Anthropic називає появу Mythos переломним моментом для кібербезпеки. У компанії вважають, що в довгостроковій перспективі такі інструменти можуть посилити захист систем, але перехідний період буде напруженим через зростання ризиків і появу нових типів атак.

Читайте також на ProIT, що Anthropic запускає Claude Design.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!