DeepL запускає функцію перекладу голосу в реальному часі

Компанія DeepL, відома своїми сервісами для перекладу текстів, презентувала нову функцію voice-to-voice перекладу в реальному часі. Про це повідомляє TechCrunch.

Її можна використовувати під час зустрічей, у мобільних і вебзастосунках, а також у групових обговореннях. Також DeepL запускає API, який дасть змогу розробникам і бізнесу створювати власні продукти на базі цієї технології.

CEO DeepL Ярек Кутиловський зазначив, що компанія досягла значного прогресу в текстовому та документному перекладі, однак досі не бачила якісного продукту для перекладу голосу в реальному часі.

За його словами, головний виклик у розробленні такої технології полягає в тому, щоб знайти баланс між мінімальною затримкою та точністю перекладу, тобто між моментом, коли людина говорить, і появою перекладеного результату.

Для нової функції DeepL підготувала доповнення для Zoom і Microsoft Teams. Користувачі зможуть або слухати переклад у реальному часі, або читати його на екрані.

Наразі сервіс працює в режимі раннього доступу й доступний не в усіх регіонах. В Україні він поки недоступний, оскільки поширюється через список очікування.

У компанії наголосили, що контролюють весь технологічний стек voice-to-voice перекладу. На цьому етапі система працює за схемою, у якій мовлення спочатку перетворюється на текст, потім текст перекладається, а після цього відтворюється синтезований голос.

У майбутньому DeepL планує створити повністю голосову модель без проміжного текстового етапу. Також технологія може адаптуватися до специфічної лексики, зокрема галузевих термінів, назв компаній і власних імен.

Нагадаємо, що у Chrome з’явилася функція Skills для збереження та повторного використання ШІ-запитів.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!