На додаток до оновлення на основі генеративного штучного інтелекту, голосовий помічник Amazon отримає більш природне звучання голосу, повідомляє TechCrunch.
Компанія представила оновлений механізм Alexa, який тепер більше враховує емоції користувача й тон голосу, що да змогу Alexa використовувати подібні емоційні зміни у своїх відповідях.
Amazon продемонстрував менш роботизоване звучання Alexa з більшою виразністю. Як зазначили у компанії, цього досягли завдяки великим трансформаторам, які були навчені іншим мовам та акцентам.
Наприклад, якщо клієнт попросив оновити інформацію про свою улюблену спортивну команду, і вона виграла останню гру, Alexa зможе відповісти радісним голосом. Однак якби вона програла, Alexa звучала б більш співчутливо.
«Ми працюємо над новою моделлю – знову ж таки з потужними трансформаторами. Замість того, щоб спочатку перетворювати аудіозапит клієнта в текст за допомогою розпізнавання мовлення, а потім використовувати LLM для створення текстової відповіді чи дії, а потім перетворювати текст у мовлення для відтворення аудіо. Вказана нова модель об’єднає ці завдання, створюючи набагато багатший досвід спілкування», – сказав Рохіт Прасад, віцепрезидент і головний науковий співробітник Alexa в Amazon.
У компанії заявили, що Alexa зможе демонструвати такі атрибути, як сміх, здивування та навіть «угукати», що заохочуватиме користувачів продовжувати розмову.
Усе це забезпечується технологіями Amazon Large Text-to-Speech (LTTS) і Speech-to-Speech (S2S). Перший дає змогу Alexa адаптувати свою відповідь за допомогою текстового введення, наприклад, запиту користувача чи теми, що обговорюється. Тоді як другий надає вхідний аудіосигнал на додаток до тексту, щоб Alexa міг адаптувати свою відповідь із більшою розмовною насиченістю, кажуть в Amazon.
Раніше ми повідомляли, що Amazon впроваджує генеративний ШІ для написання описів товарів.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодну публікацію!