Компанія Windsurf анонсувала сімейство моделей штучного інтелекту SWE-1, спеціально розроблених для охоплення всього процесу розроблення програмного забезпечення — від початкових етапів до DevOps-інтеграції. Про це повідомляє DevOps.
Більше, ніж просто генерація коду
SWE-1 — це відповідь на основну проблему сучасних ШІ-асистентів: більшість із них зосереджуються лише на генерації коду, тоді як розроблення ПЗ охоплює значно ширший спектр завдань. Як зазначили у Windsurf:
«Наша мета — прискорити розроблення на 99%. Написання коду — лише частина роботи. Моделі, які лише вміють кодити, більше не достатньо».
Сімейство SWE-1 охоплює такі моделі:
1. SWE-1 — флагманська модель, яку за логікою виклику інструментів порівнюють із Claude 3.5 Sonnet, але вона економніша у використанні. Тимчасово доступна платним користувачам без списання кредитів.
2. SWE-1-lite — середній варіант, який замінює попередню модель Cascade Base, з покращеною якістю та необмеженим доступом для всіх користувачів.
3. SWE-1-mini — швидка, компактна версія, яка забезпечує фонову інтеграцію в Windsurf Tab.
Flow awareness — головна інновація
Особливістю SWE-1 є flow awareness — здатність моделі розуміти контекст усього робочого процесу, включно з незавершеними завданнями, і взаємодіяти з людиною в режимі реального часу. Якщо користувач вносить правки, модель адаптується до них і продовжує роботу, забезпечуючи плавний перехід між діями ШІ та людини.
Показники ефективності
SWE-1 демонструє високі результати за такими основними метриками:
1. Conversational SWE Task Benchmark — перевірка вміння моделі реагувати на запити у процесі незавершеного завдання.
2. End-to-End SWE Task Benchmark — оцінювання здатності самостійно вирішувати завдання від початку до кінця.
У реальних умовах SWE-1 досягла високих показників за кількістю запропонованих рядків коду на користувача й темпом ухвалення рішень.
Інтеграція з DevOps
Моделі SWE-1 створені з урахуванням потреб DevOps-команд. Вони підтримують роботу через термінал, текстовий редактор і браузер, а також:
• враховують помилки у виводі терміналу;
• перемикаються між написанням коду та налагодженням;
• розуміють історію дій в IDE;
• реагують на фідбек користувача та результати тестування.
Компанія позиціює SWE-1 як перший крок до повного flywheel-ефекту — моделі, які навчаються на основі реальної взаємодії з користувачами й удосконалюються відповідно до їхніх потреб.
Компанія планує й надалі інвестувати в розроблення з метою перевершити результати провідних дослідницьких лабораторій у сфері ШІ для програмування.
Читайте також на ProIT: Google створює ШІ-агента, який підтримуватиме розробників на всіх етапах програмування.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!