Компанія DeepL, відома своїми сервісами для перекладу текстів, презентувала нову функцію voice-to-voice перекладу в реальному часі. Про це повідомляє TechCrunch.
Її можна використовувати під час зустрічей, у мобільних і вебзастосунках, а також у групових обговореннях. Також DeepL запускає API, який дасть змогу розробникам і бізнесу створювати власні продукти на базі цієї технології.
CEO DeepL Ярек Кутиловський зазначив, що компанія досягла значного прогресу в текстовому та документному перекладі, однак досі не бачила якісного продукту для перекладу голосу в реальному часі.
За його словами, головний виклик у розробленні такої технології полягає в тому, щоб знайти баланс між мінімальною затримкою та точністю перекладу, тобто між моментом, коли людина говорить, і появою перекладеного результату.
Для нової функції DeepL підготувала доповнення для Zoom і Microsoft Teams. Користувачі зможуть або слухати переклад у реальному часі, або читати його на екрані.
Наразі сервіс працює в режимі раннього доступу й доступний не в усіх регіонах. В Україні він поки недоступний, оскільки поширюється через список очікування.
У компанії наголосили, що контролюють весь технологічний стек voice-to-voice перекладу. На цьому етапі система працює за схемою, у якій мовлення спочатку перетворюється на текст, потім текст перекладається, а після цього відтворюється синтезований голос.
У майбутньому DeepL планує створити повністю голосову модель без проміжного текстового етапу. Також технологія може адаптуватися до специфічної лексики, зокрема галузевих термінів, назв компаній і власних імен.
Нагадаємо, що у Chrome з’явилася функція Skills для збереження та повторного використання ШІ-запитів.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!