OpenAI запустила ChatGPT agent для автоматизації складних завдань у браузері

OpenAI презентувала нову функцію ChatGPT agent — ШІ-агента, який може автоматично виконувати багатокрокові дії у браузері користувача. Про це повідомляє Silicon Angle.

Агент побудований на новій моделі, оптимізованій для логічних міркувань, яка, за даними OpenAI, перевершує попередні системи за низкою бенчмарків.

Автоматизація дій у хмарних сервісах

Новий агент призначений для автоматизації завдань, які охоплюють кілька хмарних застосунків. Наприклад, розробник може доручити йому завантажити файл із GitHub, зберегти його у папці на Google Drive, а потім запустити сканування на вразливості перед збереженням.

Агент використовує такі типи браузерів:

• Текстовий браузер, оптимізований для простих запитів, які потребують логічного міркування.

• Візуальний браузер, який імітує дії користувача на сайтах із графічним інтерфейсом.

Безпека та контроль

Перед виконанням чутливих дій, як-от покупка, ChatGPT agent запитує дозвіл користувача. OpenAI вимагає, щоб користувачі наглядали за виконанням завдань: можна зупинити процес, завершити його вручну або надати нові інструкції.

Agent може також взаємодіяти з терміналом, наприклад, для редагування файлів. За словами фахівців OpenAI:

«Модель може обрати відкриття сторінки у текстовому або візуальному браузері, завантажити файл з інтернету, обробити його через команду в терміналі й переглянути результат у візуальному браузері».

Результати тестування

Новий агент працює на моделі, яка перевершує o4-mini та o3 у завданнях на логічне мислення. У внутрішньому тесті FrontierMath, що вважається одним із найскладніших, модель агента набрала 27,4%, тоді як o4-mini — 19,3%, а o4 — 10,3%.

У тесті SpreadsheetBench, який оцінює роботу з електронними таблицями, модель ChatGPT agent перевершила вбудований в Excel Microsoft Copilot на 25%.

Захист

OpenAI впровадила нові запобіжники, зокрема захист від prompt injection — шкідливих інструкцій, вбудованих у вебсторінки.

«Ми навчали й тестували агента на виявлення і протидію інʼєкціям підказок, а також застосовуємо моніторинг для швидкого реагування на такі атаки», — йдеться у блозі компанії.

Функція вже доступна для користувачів ChatGPT Pro, Plus і Team.

Читайте також на ProIT: ШІ-агент Codex: помічник для програмістів від OpenAI.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!