Google запустила Gemini 3.1 Flash-Lite — нову економну ШІ-модель

Компанія Google представила нову модель штучного інтелекту Gemini 3.1 Flash-Lite, яка стала найдоступнішою за ціною у серії Gemini третього покоління. Рішення орієнтоване на високу швидкість обробки запитів і економічність, що робить його придатним для масштабних задач розробників.

Вартість використання моделі становить $0,25 за 1 мільйон вхідних токенів і $1,50 за 1 мільйон вихідних. У компанії зазначають, що Flash-Lite розрахована на сценарії з великою кількістю запитів і мінімальною затримкою відповіді — наприклад для автоматизованих процесів, які потребують швидкої обробки великих обсягів даних.

За результатами тестів платформи Artificial Analysis, Gemini 3.1 Flash-Lite демонструє приблизно у 2,5 раза швидший показник Time to First Answer Token порівняно з моделлю Gemini 2.5 Flash. Крім того, швидкість генерації відповідей зросла на 45%, при цьому якість результатів залишається на подібному або вищому рівні.

У рейтингу Arena.ai Leaderboard модель отримала показник Elo 1432. У тестах вона продемонструвала 86,9% у бенчмарку GPQA Diamond і 76,8% у MMMU Pro, випередивши частину моделей свого класу, а також деякі більші рішення попередніх поколінь.

Google позиціонує Flash-Lite як інструмент для широкого кола завдань — від масового перекладу, модерації контенту та класифікації даних до аналізу великих кодових баз і виконання масштабних мультимодальних операцій.

Модель уже доступна у режимі попереднього доступу через Gemini API у середовищі Google AI Studio, а також для корпоративних клієнтів через платформу Vertex AI.

Раніше дослідники з Truffle Security виявили, що тисячі публічно доступних Google API-ключів, які раніше вважалися безпечними для розміщення в клієнтському коді, тепер можуть використовуватися для доступу до Gemini AI та приватних даних.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!