Amazon Web Services (AWS) випустила оновлення свого ШІ-агента Amazon Q Developer для розробки програмного забезпечення, який, за результатами порівняльних тестів, може вирішувати на 51% більше завдань. Про це повідомляє DevOps.com.
Тест SWE-bench, створений OpenAI, оцінює здатність платформи штучного інтелекту вирішувати проблеми розробки програмного забезпечення, з якими може зіткнутися розробник Python.
Оцінка агента Amazon Q Developer підвищилася після того, як він був уперше доступний із 25,6% розв’язаних завдань до 38,8% на перевіреному наборі даних і від 13,82% до 19,75% на повному наборі даних SWE-bench.
Ці результати свідчать про те, що з часом агенти штучного інтелекту, такі як Amazon Q Developer, продовжують розвиватися, щоб використовувати переваги можливостей аргументації, які забезпечують великі мовні моделі (LLM) для вирішення все більш складних завдань.
Тим часом багато розробників уже використовують інтерфейс природної мови, який надає Amazon Q Developer, щоб аналізувати наявні кодові бази та вносити зміни в код за лічені хвилини.
Це дає змогу організаціям бути в курсі останніх поколінь оновлень мов програмування. Наприклад, зменшувати рівень зусиль, необхідний для оновлення до останньої версії Java. У довгостроковій перспективі генеративні інструменти штучного інтелекту, такі як Amazon Q Developer, полегшать перетворення коду, написаного однією мовою програмування, на іншу.
Загалом агенти ШІ навчені виконувати набагато ширший спектр складних завдань. Агент Amazon Q Developer може відкривати, створювати та закривати файли, вибирати й скасовувати фрагменти коду, знаходити та замінювати код, а також скасовувати зміни, якщо потрібно.
Відповідь викликаних інструментів потім включається в оновлену підказку, яка повертається до LLM для ухвалення рішення щодо його подальших дій. Агент самостійно вирішить, що він згенерував відповідні зміни для виконання запиту, який потім надає розробнику для перегляду.
AWS також розробила фреймворк текстового коду для агента Amazon Q Developer, який використовує маркери для створення представлень коду, файлів і робочих областей, що полегшує LLM виявлення елементів середовища розробки програмного забезпечення.
Поки незрозуміло, скільки розробників скористалися генеративним штучним інтелектом не лише для написання коду, але й для керування завданнями, але оскільки LLM продовжують розвиватися, темпи створення та розгортання застосунків мають значно прискоритися.
Читайте також на ProIT, що Intel об’єднується з AWS для спільної розробки чипа ШІ.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!