ШІ-агент Codex: помічник для програмістів від OpenAI

OpenAI представила Codex — хмарного агента для програмування, здатного змінити підходи розробників до виконання рутинних і комплексних завдань. Про це повідомляє DevOps.

Створений на базі спеціалізованої версії моделі o3 під назвою codex-1, цей інструмент може працювати з кількома завданнями одночасно та функціонує як повноцінний помічник, що розуміє кодову базу користувача.

Що таке Codex

Codex — це AI-помічник для програмування, який працює як хмарний агент. На відміну від традиційних інструментів автозаповнення, Codex здатний самостійно братися за виконання завдань. Розробники можуть доручати йому створення нових функцій, аналіз коду, виправлення помилок і формування pull request'ів для перегляду.

Унікальність Codex — у здатності виконувати завдання паралельно в окремих середовищах, кожне з яких попередньо завантажене з репозиторію.

Як працює Codex

Codex інтегровано в інтерфейс ChatGPT. Розробник може створити нове завдання, натиснувши Code, або задати запитання щодо кодової бази через Ask. Кожне завдання працює автономно в окремому середовищі з попередньо завантаженим кодом.

Codex може читати та редагувати файли, запускати команди, у тому числі тести, лінтери й перевірки типів. Залежно від складності, виконання завдання займає від 1 до 30 хвилин, а розробник може відстежувати прогрес у реальному часі.

Особливо цінною є можливість Codex надавати перевірені докази своїх дій — журнали терміналу й результати тестів, що забезпечує прозорість і підвищує довіру до інструменту.

Технологія за Codex

Codex працює на базі моделі codex-1 — спеціальної версії o3, оптимізованої для інженерних задач. Модель навчена з використанням методів навчання з підкріпленням на реальних завданнях програмування і здатна:

• імітувати стиль написання коду людиною і підходи до формування pull request'ів;

• точно дотримуватись інструкцій;

• повторно запускати тести до отримання позитивного результату

Модель демонструє високу якість виконання завдань навіть без спеціального конфігурування чи шаблонів.

Приклади використання

• OpenAI застосовує Codex для повторюваних, чітко окреслених задач: рефакторингу, перейменування, написання тестів.

• Cisco досліджує можливості Codex для пришвидшення втілення інженерних ідей.

• Temporal використовує Codex для прискорення розробки функцій, виправлення помилок і рефакторингу великих кодових баз.

• Superhuman дозволяє менеджерам вносити дрібні зміни в код без участі інженера.

• Kodiak залучає Codex для створення інструментів дебагу, розширення покриття тестами та оптимізації коду у сфері автономного водіння.

Безпека та захист

Codex працює у безпечному ізольованому середовищі без доступу до інтернету під час виконання завдань. Агент обмежений лише тими файлами, що явно передані через репозиторій GitHub і попередньо встановлені залежності.

OpenAI навчила Codex розпізнавати й відхиляти запити на створення шкідливого ПЗ, зберігаючи при цьому підтримку легітимних задач. До політики безпеки додано посилені механізми перевірки й оцінювання ризиків.

Майбутнє розробки

Codex демонструє зміну парадигми у взаємодії з інструментами штучного інтелекту. Якщо раніше домінував режим спільної роботи з AI у реальному часі, то тепер OpenAI просуває асинхронний мультиагентний підхід як новий стандарт програмної інженерії.

У майбутньому ці два підходи об’єднаються — розробники зможуть як спілкуватися з агентами в IDE, так і передавати їм складні задачі на виконання з подальшим контролем і коригуванням.

Codex відкриває нові можливості для програмної інженерії, особливо корисні для окремих розробників і малих команд. Попри ранню стадію розвитку, це — важливий крок у напрямі того, щоб ШІ став незамінним учасником команди.

Читайте також на ProIT: Google запустила AlphaEvolve — ШІ-агента для створення математичних алгоритмів.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!