Цього тижня дослідники Microsoft представили нову мультиагентну AI-систему, призначену для автоматизації складних завдань для підприємств, які зазвичай потребують людського втручання. Про це повідомляє Redmond Mag.
Проєкт під назвою Magnetic-One — це open source проєкт, розроблений для виконання широкого спектру складних відкритих завдань в Інтернеті та у файлових середовищах.
Microsoft зазначила, що нова система дозволить ШІ-агентам не лише спілкуватися з користувачами, а й виконувати складні багатоступеневі завдання, що є важливим кроком у розвитку штучного інтелекту.
«Це як різниця між генеративним AI, що рекомендує варіанти вечері, й агентними помічниками, які можуть автономно оформити замовлення та організувати доставку. Це перехід від простого підсумовування дослідницьких статей до активного пошуку й організації відповідних досліджень у комплексному огляді літератури», — написали дослідники Microsoft.
Подібно до Agentforce від Salesforce Magnetic-One використовує мультиагентну систему для автоматизації та виконання завдань. У центрі системи перебуває агент «Оркестратор», який керує та координує роботу чотирьох спеціалізованих агентів: WebSurfer, FileSurfer, Coder і ComputerTerminal.
Кожен агент відповідає за конкретну функцію, включно з навігацією в Інтернеті, роботою з файлами, програмуванням та операціями у командному рядку.
«Оркестратор» динамічно призначає підзадачі, контролює прогрес та адаптує свою стратегію для виконання складних завдань із мінімальним втручанням людини.
«Оркестратор» планує, відстежує прогрес і переплановує дії, щоб відновитися після помилок, направляючи спеціалізованих агентів для виконання таких завдань, як робота у веббраузері, навігація по локальних файлах або написання й виконання коду на Python», — написали дослідники з Microsoft AI.
Корпорація випускає Magnetic-One як проєкт із відкритим кодом для дослідників і розробників. Хоча система демонструє сильні загальні можливості, її продуктивність ще нижча за рівень людини, і вона може стикатися з помилками.
За словами представників Microsoft, із розширенням можливостей агентних систем можуть зростати ризики, такі як непередбачувані дії чи потенційне зловживання.
Визнаючи, що агентний AI перебуває на ранніх етапах розвитку, Microsoft розраховує на допомогу користувачів у подоланні цих викликів і забезпеченні ефективності та безпеки майбутніх систем через їхнє використання.
Для цього компанія також представляє AutoGenBench — інструмент оцінки, розроблений для ретельного тестування агентних завдань із вбудованими контролями, щоб мінімізувати небажані побічні ефекти за допомогою повторень та ізоляції.
«AutoGenBench спрощує оцінку агентних систем і дає змогу додавати нові тестові орієнтири. Використовуючи AutoGenBench, можна оцінювати Magnetic-One за різними орієнтирами. Нашим критерієм вибору орієнтирів є те, що вони повинні включати складні багатоступеневі завдання. Принаймні деякі з них потребують планування і використання інструментів, зокрема браузерів для дій на реальних або змодельованих вебсторінках. У цій роботі ми розглядаємо три орієнтири, які відповідають цьому критерію: GAIA, AssistantBench і WebArena», — йдеться у повідомленні.
Ті, хто хоче випробувати Magnetic-One, можуть завантажити його за посиланням.
Читайте також на ProIT: Microsoft подала заявку на патент для технічного методу, який може зменшити або припинити виникнення «галюцинацій» ШІ.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!