ProIT: медіа для профі в IT
2 хв

OpenAI презентувала ChatGPT Agent: новий інструмент для роботи з Excel, PowerPoint і браузером

author avatar ProIT NEWS

OpenAI анонсувала ChatGPT Agent — універсального агента, який поєднує навички вебперегляду (Operator) і можливості глибинного узагальнення (Deep Research) в одному інструменті. Про це повідомляє InfoQ.

Тепер замість того, щоб копіювати код чи формули в ChatGPT і вручну переносити відповіді у таблиці або презентації, можна одним запитом отримати готовий .xlsx чи .pptx файл.

Як це працює

За лаштунками ChatGPT Agent генерує Python-код, який створює файли у відкритих форматах. Ці документи можна відкривати у:

Microsoft Excel;

LibreOffice;

PowerPoint;

Keynote;

будь-якій програмі, яка підтримує .xlsx / .pptx

За потреби агент:

▪️ входить у SaaS-сервіси через конектори;

▪️ переглядає вебсторінки через текстовий або GUI-браузер;

▪️ виконує код у терміналі;

▪️ перетворює дані й розміщує результат у табличному редакторі;

▪️ генерує файл і пропонує посилання для завантаження.

Продуктивність і бенчмарки

На SpreadsheetBench агент сягнув 45,5% точності проти 20% у Copilot for Excel. OpenAI також заявляє про нові state-of-the-art результати на DSBench і BrowseComp, а також 41,6% pass@1 на Humanity’s Last Exam. Усі бенчмарки передбачають, що агент має доступ до виконання коду та перегляду сторінок.

«Я б пояснив це своїй родині так: я б поки не використовував цей агент для критичних завдань або для даних, які містять особисту інформацію, доки ми не вивчимо його краще в реальних умовах», — зазначив CEO OpenAI Сем Альтман.

Для розробників

Для розробників агент — це просто ще один інструмент ChatGPT. Якщо ви працюєте з Assistants API, він уже доступний. Завдяки конекторам агент може працювати з:

приватними GitHub-репозиторіями;

Grafana-дашбордами;

будь-якими внутрішніми системами.

Також уже є приклади використання:

Generative-Excel-Data-Assistant;

блокноти Azure з agent-інтеграцією;

список awesome-ai-agents — колекція відкритих проєктів для форку.

Недоліки й обмеження

За даними ZDNet, лише одне із восьми складних завдань агент виконав без галюцинацій.

Деякі завдання виконувалися до 30 хвилин, хоча люди робили це за 15.

Високий ризик помилок і повільна робота при одночасному використанні кількох інструментів.

Потрібна високоякісна навчальна розмітка, на що OpenAI і Meta витрачають мільярди доларів.

Щоб досягти високої якості, агентні моделі потребують великої кількості анотованих людиною даних. Саме тому:

Meta інвестувала $14 мільярдів у Scale AI.

Turing залучила понад 4 мільйони розмітників і зросла до $300 мільйонів виручки.

Crowdsourcing через Amazon Mechanical Turk залишається популярним для edge-case запитів.

OpenAI радить:

тестувати результати як чорнові;

ізолювати облікові дані;

логувати дії агента.

Це важливі кроки для впровадження агентів у робочі середовища.

Читайте також на ProIT: OpenAI запустила ChatGPT agent для автоматизації складних завдань у браузері.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.