OpenAI анонсувала ChatGPT Agent — універсального агента, який поєднує навички вебперегляду (Operator) і можливості глибинного узагальнення (Deep Research) в одному інструменті. Про це повідомляє InfoQ.
Тепер замість того, щоб копіювати код чи формули в ChatGPT і вручну переносити відповіді у таблиці або презентації, можна одним запитом отримати готовий .xlsx
чи .pptx
файл.
Як це працює
За лаштунками ChatGPT Agent генерує Python-код, який створює файли у відкритих форматах. Ці документи можна відкривати у:
• Microsoft Excel;
• LibreOffice;
• PowerPoint;
• Keynote;
• будь-якій програмі, яка підтримує .xlsx
/ .pptx
За потреби агент:
▪️ входить у SaaS-сервіси через конектори;
▪️ переглядає вебсторінки через текстовий або GUI-браузер;
▪️ виконує код у терміналі;
▪️ перетворює дані й розміщує результат у табличному редакторі;
▪️ генерує файл і пропонує посилання для завантаження.
Продуктивність і бенчмарки
На SpreadsheetBench агент сягнув 45,5% точності проти 20% у Copilot for Excel. OpenAI також заявляє про нові state-of-the-art результати на DSBench і BrowseComp, а також 41,6% pass@1 на Humanity’s Last Exam. Усі бенчмарки передбачають, що агент має доступ до виконання коду та перегляду сторінок.
«Я б пояснив це своїй родині так: я б поки не використовував цей агент для критичних завдань або для даних, які містять особисту інформацію, доки ми не вивчимо його краще в реальних умовах», — зазначив CEO OpenAI Сем Альтман.
Для розробників
Для розробників агент — це просто ще один інструмент ChatGPT. Якщо ви працюєте з Assistants API, він уже доступний. Завдяки конекторам агент може працювати з:
• приватними GitHub-репозиторіями;
• Grafana-дашбордами;
• будь-якими внутрішніми системами.
Також уже є приклади використання:
• Generative-Excel-Data-Assistant;
• блокноти Azure з agent-інтеграцією;
• список awesome-ai-agents — колекція відкритих проєктів для форку.
Недоліки й обмеження
• За даними ZDNet, лише одне із восьми складних завдань агент виконав без галюцинацій.
• Деякі завдання виконувалися до 30 хвилин, хоча люди робили це за 15.
• Високий ризик помилок і повільна робота при одночасному використанні кількох інструментів.
• Потрібна високоякісна навчальна розмітка, на що OpenAI і Meta витрачають мільярди доларів.
Щоб досягти високої якості, агентні моделі потребують великої кількості анотованих людиною даних. Саме тому:
• Meta інвестувала $14 мільярдів у Scale AI.
• Turing залучила понад 4 мільйони розмітників і зросла до $300 мільйонів виручки.
• Crowdsourcing через Amazon Mechanical Turk залишається популярним для edge-case запитів.
OpenAI радить:
• тестувати результати як чорнові;
• ізолювати облікові дані;
• логувати дії агента.
Це важливі кроки для впровадження агентів у робочі середовища.
Читайте також на ProIT: OpenAI запустила ChatGPT agent для автоматизації складних завдань у браузері.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!