ProIT: медіа для профі в IT
2 хв

Deepgram запускає голосовий фреймворк для розробників

author avatar ProIT NEWS

Компанія Deepgram створила фреймворк, що використовує технології штучного інтелекту (ШІ), аби дати змогу розробникам автоматизувати низку завдань за допомогою лише голосового запиту, повідомляє DevOps.

За словами Наталі Рутгерс, віцепрезидентки з продукту в Deepgram, новий інструмент під назвою Deepgram Saga — це фактично голосова операційна система, яку можна накладати поверх наявних інструментів і платформ. Вона перетворює природну мову на серію запитів, які активують Model Context Protocol (MCP), розроблений компанією Anthropic.

Завдяки одному голосовому запиту розробник може, наприклад, запустити тести, закомітити зміни, виконати деплой, а потім надіслати оновлення команді — використовуючи будь-який інструмент або платформу з підтримкою MCP-сервера. Це усуває потребу вводити команди вручну чи перемикатися між AI-чатами.

Інший сценарій використання: розробник може усно описати ідею, яку Deepgram Saga перетворює на набір запитів до AI-інструментів програмування. Saga фіксує потік свідомості та трансформує його в структуровану документацію, тікети або описи pull-запитів.

«Deepgram уже майже десятиліття допомагає створювати голосові застосунки, але тепер ми пропонуємо фреймворк ШІ, орієнтований спеціально на задачі програмної інженерії», — пояснила Рутгерс. — «Saga розуміє технічний контекст, специфічну термінологію та нюанси мови, яку зазвичай використовують розробники».

Хоча важко передбачити, наскільки розробники будуть готові відмовитися від клавіатури, багато з них, ймовірно, вважатимуть за краще делегувати деякі завдання голосовим агентам ШІ. Хоча результат усе ще потребуватиме рецензування, голосовий інтерфейс полегшує поєднання кількох кроків в один робочий процес.

Швидкість впровадження ШІ в розробку зростає. Згідно з опитуванням Futurum Group, 41% респондентів очікують, що генеративні інструменти ШІ будуть використовуватись для створення, перевірки й тестування коду. Крім того, у найближчі 12–18 місяців компанії планують збільшити витрати на генерацію коду за допомогою ШІ (83%), агентні технології (76%) та вже знайомі інструменти, доповнені AI-функціями.

Deepgram робить ставку на голосовий інтерфейс як спосіб пришвидшити впровадження таких інструментів, усунувши потребу в опануванні prompt engineering.

Розробникам ще доведеться вирішити, наскільки вони готові повністю відмовитись від друкування, але вже зараз зрозуміло: багато хто проводитиме більше часу, рецензуючи результати роботи ШІ, ніж пишучи код вручну. Це вимагатиме змін у підходах до роботи — хоча в деяких випадках простіше все ж таки щось надрукувати, а не сказати вголос.

Але попри будь-яку звичку до клавіатури, прагнення до продуктивності, найімовірніше, спонукатиме дедалі більше розробників використовувати голосовий інтерфейс, коли він дозволяє швидко давати інструкції цілій армії AI-асистентів.

Нагадаємо, Anthropic додала до свого ШІ-асистента Claude нову функцію, яка дозволяє створювати повноцінні застосунки безпосередньо у вікні чату.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.