Google запустила Gemini 2.5 Flash — нову версію своєї легкої моделі ШІ, яка підтримує гібридний режим мислення та демонструє конкурентні результати у бенчмарках.
Її особливістю є можливість вмикати або вимикати мислення залежно від завдання, що дає можливість досягати кращого балансу між вартістю, продуктивністю й точністю.
Модель уже доступна в Google AI Studio, Vertex AI та застосунку Gemini, де її можна протестувати разом із новими функціями, зокрема Canvas — інтерактивним простором для спільної роботи над текстами й кодом.
Порівняння із конкурентами: швидкість, ціна, якість
Ціни:
Вхідні токени: $0,15 за 1 мільйон.
Вихідні токени: $0,60 за 1 мільйон (без мислення), $3,50 за 1 мільйон (із мисленням).
Для порівняння, OpenAI o4-mini — $1,10/$4,40, Claude 3.7 — $3/$15.
Ключові бенчмарки:
1. Humanity’s Last Exam (мислення): 12,1%.
2. GPQA (наука, один запуск): 78,3%.
3. AIME 2025 (математика): 78%.
4. AIME 2024 (математика): 88% (кращий серед більшості конкурентів).
5. LiveCodeBench (кодогенерація): 63,5%.
6. Aider Polyglot (редагування коду): 51,1%/44,2%.
7. MMM (візуальне мислення): 76,7%.
8. Vibe-Eval (розуміння зображень): 62%.
9. MRCR (довгий контекст, 128k): 82,4%.
10. Global MMLU Lite (мультимовна точність): 88,4%.
Що це означає для розробників
Gemini 2.5 Flash — перша модель Google із налаштовуваним мисленням. Розробники можуть:
• вибирати між швидкістю (режим без мислення) і глибиною аналізу (режим мислення);
• контролювати бюджет на обчислення для кожного запиту;
• використовувати модель для обробки коду, математики, довгих текстів, візуального аналізу та мультимовних завдань.
Google позиціює цю модель як Pareto-оптимальну. Вона забезпечує найкраще співвідношення ціни, продуктивності та якості серед конкурентів.
Про всю родину моделей Gemini 2.5 із підтримкою міркування читайте за посиланням.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!