Google презентувала Gemini 2.5 Flash — ШІ-модель із налаштовуваним рівнем мислення

Google запустила Gemini 2.5 Flash — нову версію своєї легкої моделі ШІ, яка підтримує гібридний режим мислення та демонструє конкурентні результати у бенчмарках.

Її особливістю є можливість вмикати або вимикати мислення залежно від завдання, що дає можливість досягати кращого балансу між вартістю, продуктивністю й точністю.

Модель уже доступна в Google AI Studio, Vertex AI та застосунку Gemini, де її можна протестувати разом із новими функціями, зокрема Canvas — інтерактивним простором для спільної роботи над текстами й кодом.

Порівняння із конкурентами: швидкість, ціна, якість

Ціни:

Вхідні токени: $0,15 за 1 мільйон.

Вихідні токени: $0,60 за 1 мільйон (без мислення), $3,50 за 1 мільйон (із мисленням).

Для порівняння, OpenAI o4-mini — $1,10/$4,40, Claude 3.7 — $3/$15.

Ключові бенчмарки:

1. Humanity’s Last Exam (мислення): 12,1%.

2. GPQA (наука, один запуск): 78,3%.

3. AIME 2025 (математика): 78%.

4. AIME 2024 (математика): 88% (кращий серед більшості конкурентів).

5. LiveCodeBench (кодогенерація): 63,5%.

6. Aider Polyglot (редагування коду): 51,1%/44,2%.

7. MMM (візуальне мислення): 76,7%.

8. Vibe-Eval (розуміння зображень): 62%.

9. MRCR (довгий контекст, 128k): 82,4%.

10. Global MMLU Lite (мультимовна точність): 88,4%.

Що це означає для розробників

Gemini 2.5 Flash — перша модель Google із налаштовуваним мисленням. Розробники можуть:

• вибирати між швидкістю (режим без мислення) і глибиною аналізу (режим мислення);

• контролювати бюджет на обчислення для кожного запиту;

• використовувати модель для обробки коду, математики, довгих текстів, візуального аналізу та мультимовних завдань.

Google позиціює цю модель як Pareto-оптимальну. Вона забезпечує найкраще співвідношення ціни, продуктивності та якості серед конкурентів.

Про всю родину моделей Gemini 2.5 із підтримкою міркування читайте за посиланням.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!