Компанія Google без офіційного анонсу випустила новий застосунок для диктування — Google AI Edge Eloquent, який працює переважно офлайн і використовує локальні AI-моделі.
Застосунок уже доступний на iOS і є безкоштовним. Після завантаження моделей розпізнавання мовлення на базі Gemma користувачі можуть диктувати текст без підключення до інтернету. У режимі реального часу додаток відображає транскрипцію, а після завершення автоматично очищає її від слів-паразитів на кшталт «um» і «ah», формуючи більш структурований текст.
Крім базового диктування, Google AI Edge Eloquent пропонує інструменти для редагування тексту. Користувач може обрати варіанти обробки — «Key points», «Formal», «Short» або «Long», щоб адаптувати результат під конкретний формат.
Застосунок підтримує як локальну, так і хмарну обробку. У режимі cloud він використовує моделі Gemini для покращення тексту, однак користувач може повністю вимкнути передачу даних і працювати лише на пристрої.
Також доступні персоналізаційні функції. Додаток може імпортувати ключові слова, імена та терміни з Gmail, а також дозволяє вручну додавати власні словники. Історія диктування зберігається, її можна переглядати та шукати. Серед додаткових метрик — швидкість мовлення та загальна кількість продиктованих слів.
У описі в App Store зазначається, що застосунок створений для перетворення природного мовлення у «професійний, готовий до використання текст», а не просто дослівну транскрипцію.
Наразі застосунок доступний лише на iOS. Раніше в описі згадувалась Android-версія, однак Google прибрала ці згадки. Водночас компанія натякає на майбутню інтеграцію з Android, зокрема як системної клавіатури з доступом у будь-якому текстовому полі.
Запуск відбувається на фоні зростання популярності AI-диктування, де Google конкурує з такими рішеннями, як Wispr Flow, SuperWhisper і Willow. У разі успіху експерименту компанія може інтегрувати подібні функції безпосередньо в Android.
Це сигнал, що Google активно рухається у напрямку on-device AI та приватності. Офлайн-диктування без передачі даних у хмару — критичний фактор для бізнес-користувачів і розробників. Крім того, це може змінити UX введення тексту в мобільних ОС і посилити конкуренцію на ринку voice AI.
Читайте на ProIT: Google презентувала Gemma 4 — сімейство відкритих ШІ-моделей для хмари, ПК і смартфонів.