OpenAI робить серйозну ставку на аудіо-ШІ. Йдеться не лише про те, щоб ChatGPT звучав краще. Як повідомляє The Information, за останні 2 місяці компанія об’єднала кілька інженерних, продуктових і дослідницьких команд, щоб оновити свої аудіомоделі. Усе це — в межах підготовки до запуску персонального пристрою з фокусом на аудіо, запланованого до презентації приблизно за рік.
Вказаний крок відображає загальний напрям технологічної індустрії — до майбутнього, де екрани відійдуть на задній план, а аудіо стане центральним елементом.
Meta нещодавно презентувала функцію для своїх смартокулярів Ray-Ban, яка використовує масив із п’яти мікрофонів, щоб допомогти чути розмови у галасливих приміщеннях, фактично перетворюючи ваше обличчя на спрямований слуховий пристрій.
Google у червні почала експериментувати з функцією Audio Overviews, яка перетворює результати пошуку на розмовні резюме. Tesla інтегрує чат-бота Grok від xAI у свої автомобілі, щоб створити голосового асистента, здатного вести природний діалог і керувати всім — від навігації до клімат-контролю.
Ставки на аудіо роблять не лише технологічні гіганти. З’явилася група стартапів із тим самим переконанням, хоча й із різним ступенем успіху. Формати можуть відрізнятися, але ідея одна: аудіо — це інтерфейс майбутнього. Усі простори (ваш дім, ваша машина, навіть ваше обличчя) перетворюються на поверхню для керування.
Нова аудіомодель OpenAI, яка має вийти на початку 2026 року, за чутками, звучатиме природніше, реагуватиме на перебивання як справжній співрозмовник і навіть зможе говорити одночасно з вами, на відміну від теперішніх моделей, які на це не здатні.
Також компанія нібито уявляє собі лінійку пристроїв, можливо окуляри або «розумні» динаміки без екранів, які будуть не просто інструментами, а радше компаньйонами.
Усе це не надто дивує. Як зазначає The Information, колишній головний дизайнер Apple Джоні Айв, який приєднався до апаратного напряму OpenAI після того, як компанія у травні придбала його фірму LoveFrom за $6,5 мільярдів, зробив зменшення залежності від гаджетів своєю метою. Він бачить в аудіо-першому дизайні можливість виправити помилки минулих споживчих пристроїв.
Раніше ми повідомляли, що OpenAI розгортає нову можливість у ChatGPT — інтеграції з популярними застосунками, які дають можливість під’єднувати сторонні сервіси безпосередньо до чат-асистента й виконувати дії від імені користувача.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!