Французька компанія Mistral AI анонсувала появу Mistral OCR — нового API для оптичного розпізнавання символів (OCR), який дає можливість точно розпізнавати текст, медіа, таблиці та рівняння з документів. Про це йдеться на сторінці компанії.
Що відомо про новий сервіс?
За словами представників Mistral AI, їхній інструмент забезпечує майже 99% точності та відрізняється від аналогів, зокрема OpenAI, можливістю повноцінного розпізнавання всіх елементів документа.
Mistral OCR працює із зображеннями та PDF-файлами, перетворюючи їх на структурований текст і графіку. Сервіс уже інтегрований у фірмовий чат-бот Le Chat, який має понад 1 мільйон користувачів. Також компанія запустила API mistral-ocr-latest, доступний у пакеті розробника la Plateforme.
Скільки це коштує?
Вартість використання Mistral OCR стартує від $1 за 1000 сторінок, а при пакетній обробці ціна зменшується вдвічі.
У компанії також заявили, що найближчим часом API стане доступним через хмарних партнерів, а також у форматі локального розгортання.
Чому це важливо?
Mistral OCR має високу сумісність із системами RAG (Retrieval-Augmented Generation), які працюють із мультимодальними документами, що містять відео, зображення, таблиці та навіть математичні задачі. Це відкриває широкі можливості для автоматизації роботи з документами.
Раніше ми повідомляли, що Mistral AI оголошує партнерство з AFP для покращення точності Le Chat.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!