ProIT: медіа для профі в IT
Приблизно хвилину

Mistral випустила Voxtral — свою першу відкриту аудіомодель ШІ

author avatar ProIT NEWS

У міру того, як ШІ-системи стають дедалі функціональнішими, голос стрімко перетворюється на основний спосіб взаємодії з машинами. Французький стартап Mistral долучився до аудіоперегонів, презентувавши свою першу відкриту аудіомодель Voxtral, орієнтовану на бізнес-користувачів. Про це повідомляє Tech Crunch.

Mistral позиціює Voxtral як першу відкриту модель, яка здатна забезпечити реально придатний голосовий інтелект для продакшену. Це означає, що розробникам більше не доведеться вибирати між відкритою, дешевою системою, яка помиляється у транскрипціях, або закритою, якісною, але дорогою та з обмеженим контролем.

У Mistral стверджують, що Voxtral коштує дешевше, ніж більшість аналогічних комерційних рішень.

Можливості моделі Voxtral

• Транскрипція до 30 хвилин аудіо.

• Завдяки LLM-базі Mistral Small 3.1 здатна розуміти до 40 хвилин контенту, включно з:

– відповідями на запитання щодо змісту;

– генерацією резюме;

– голосовими командами із запуском функцій (наприклад, викликами API).

• Підтримка кількох мов, зокрема:

– англійська;

– іспанська;

– французька;

– португальська;

– хінді;

– німецька;

– нідерландська;

– італійська.

Варіанти Voxtral: для продакшену і для edge-рішень

Voxtral Small

• 24 мільярди параметрів.

• Орієнтований на масштабне корпоративне використання.

• Конкуренти: ElevenLabs Scribe, GPT-4o-mini, Gemini 2.5 Flash.

Voxtral Mini

• 3 мільярди параметрів.

• Для локального використання або edge-пристроїв.

• Є також Voxtral Mini Transcribe — полегшена версія лише для транскрипції: ще дешевша, швидша, яка перевершує OpenAI Whisper менш ніж за половину ціни.

Спробувати Voxtral можна безкоштовно через API на Hugging Face або в чатботі Le Chat від Mistral. Інтеграція API в застосунки стартує від $0,001 за хвилину.

Запуск Voxtral відбувся через місяць після анонсу Magistral — першої серії моделей Mistral для покрокового розв’язання задач із фокусом на надійність.

Mistral — один із провідних AI-гравців Європи, відомий своєю позицією на підтримку open source. Компанія веде переговори щодо залучення до $1 мільярда інвестицій від фондів на кшталт MGX (Абу-Дабі).

Читайте також на ProIT, як клонувати голос за допомогою Personal Voice.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.