OpenAI презентувала нову функцію ChatGPT agent — ШІ-агента, який може автоматично виконувати багатокрокові дії у браузері користувача. Про це повідомляє Silicon Angle.
Агент побудований на новій моделі, оптимізованій для логічних міркувань, яка, за даними OpenAI, перевершує попередні системи за низкою бенчмарків.
Автоматизація дій у хмарних сервісах
Новий агент призначений для автоматизації завдань, які охоплюють кілька хмарних застосунків. Наприклад, розробник може доручити йому завантажити файл із GitHub, зберегти його у папці на Google Drive, а потім запустити сканування на вразливості перед збереженням.
Агент використовує такі типи браузерів:
• Текстовий браузер, оптимізований для простих запитів, які потребують логічного міркування.
• Візуальний браузер, який імітує дії користувача на сайтах із графічним інтерфейсом.
Безпека та контроль
Перед виконанням чутливих дій, як-от покупка, ChatGPT agent запитує дозвіл користувача. OpenAI вимагає, щоб користувачі наглядали за виконанням завдань: можна зупинити процес, завершити його вручну або надати нові інструкції.
Agent може також взаємодіяти з терміналом, наприклад, для редагування файлів. За словами фахівців OpenAI:
«Модель може обрати відкриття сторінки у текстовому або візуальному браузері, завантажити файл з інтернету, обробити його через команду в терміналі й переглянути результат у візуальному браузері».
Результати тестування
Новий агент працює на моделі, яка перевершує o4-mini та o3 у завданнях на логічне мислення. У внутрішньому тесті FrontierMath, що вважається одним із найскладніших, модель агента набрала 27,4%, тоді як o4-mini — 19,3%, а o4 — 10,3%.
У тесті SpreadsheetBench, який оцінює роботу з електронними таблицями, модель ChatGPT agent перевершила вбудований в Excel Microsoft Copilot на 25%.
Захист
OpenAI впровадила нові запобіжники, зокрема захист від prompt injection — шкідливих інструкцій, вбудованих у вебсторінки.
«Ми навчали й тестували агента на виявлення і протидію інʼєкціям підказок, а також застосовуємо моніторинг для швидкого реагування на такі атаки», — йдеться у блозі компанії.
Функція вже доступна для користувачів ChatGPT Pro, Plus і Team.
Читайте також на ProIT: ШІ-агент Codex: помічник для програмістів від OpenAI.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!