ProIT: медіа для профі в IT
2 хв

Китайська війна ШІ-моделей: Alibaba відповідає на виклик DeepSeek

author avatar ProIT NEWS

Китайська технологічна компанія Alibaba представила оновлену версію своєї AI-моделі Qwen 2.5, заявивши, що вона перевершує DeepSeek-V3 — одну з найпопулярніших AI-моделей останнього часу. Про це повідомляє Reuters.

Презентація Qwen 2.5-MAX відбулася в перший день Китайського Нового року, коли більшість жителів країни відпочивають. Такий незвичайний час релізу, ймовірно, свідчить про тиск на Alibaba з боку DeepSeek, яка за останні три тижні здійснила стрімкий прорив на AI-ринку не лише в Китаї, а й на міжнародному рівні.

Qwen 2.5-MAX vs. GPT-4o, DeepSeek-V3 і Llama-3

За словами фахівців хмарного підрозділу Alibaba, модель Qwen 2.5-MAX демонструє кращі результати за більшістю тестів порівняно із:

  • GPT-4o від OpenAI,
  • DeepSeek-V3,
  • Llama-3.1-405B від Meta.

10 січня DeepSeek представила ШІ-асистента на основі DeepSeek-V3, а вже 20 січня компанія випустила модель DeepSeek-R1, яка викликала шок у Кремнієвій долині.

Причина? Низька вартість розробки та використання нової моделі. Це поставило під сумнів величезні витрати американських ШІ-компаній і спричинило падіння технологічних акцій.

Крім того, успіх DeepSeek змусив китайські компанії терміново покращувати свої моделі. Вже через два дні після релізу DeepSeek-R1 компанія ByteDance (власник TikTok) оновила свій флагманський ШІ-модельний ряд.

ByteDance заявила, що її новий ШІ перевершує OpenAI o1 у тесті AIME, який оцінює якість розуміння та обробки складних інструкцій. Це повторює твердження DeepSeek про те, що її модель R1 не поступається OpenAI o1 в основних тестах продуктивності.

DeepSeek і війна цін на AI у Китаї

DeepSeek вже стала головним гравцем на китайському ШІ-ринку після того, як її модель DeepSeek-V2, представлена у травні 2024 року, спровокувала війну цін.

Основною перевагою DeepSeek-V2 була її відкритість і наднизька ціна — лише 1 юань ($0,14) за 1 мільйон токенів. Це змусило Alibaba знизити ціни на свої ШІ-моделі на 97%. Цим прикладом скористалися й інші китайські технологічні гіганти, зокрема:

  • Baidu (9888.HK), яка ще в березні 2023 року представила перший у Китаї аналог ChatGPT.
  • Tencent (0700.HK), яка також запустила низку конкурентних моделей.

Стратегія DeepSeek: ставка на AGI, а не на прибуток

Лян Венфен, загадковий засновник DeepSeek, рідко дає інтерв’ю. Але у липні 2024 року він вперше висловився про стратегію компанії у розмові з китайським медіа Waves.

Головні тези Ляна:

  • DeepSeek не хвилюють цінові війни. Головна мета компанії — AGI (Artificial General Intelligence, загальний штучний інтелект).
  • OpenAI визначає AGI як автономні системи, що перевершують людей у більшості економічно важливих завдань.
  • DeepSeek працює як дослідницька лабораторія, у якій більшість співробітників — молоді випускники й аспіранти топових китайських університетів.
  • На відміну від Alibaba й інших техногігантів, DeepSeek має гнучку структуру управління та мінімізує витрати.
  • Лян вважає, що найбільші китайські технологічні компанії не є оптимальними для розвитку AI, оскільки мають занадто високі витрати та громіздку структуру.
«Великі мовні моделі потребують постійного інноваційного розвитку. Можливості техногігантів мають свої межі», — підсумував він.

З кожним місяцем конкуренція серед китайських AI-компаній лише посилюється. DeepSeek здійснила потужний прорив і змусила Alibaba, ByteDance, Baidu та Tencent терміново оновлювати свої AI-моделі.

Водночас Alibaba відповіла релізом Qwen 2.5, заявивши, що він перевершує навіть GPT-4o і Llama-3.

Однак головне питання залишається відкритим: чи зможе Alibaba наздогнати DeepSeek, яка впевнено просувається до AGI? Чи дійсно Qwen 2.5 є проривом? Чи це лише маркетингова відповідь на успіх DeepSeek?

Китайська ШІ-індустрія зараз є однією з найдинамічніших у світі, і найближчі місяці покажуть, хто вийде переможцем у цій технологічній гонитві.

Читайте також на ProIT: Китайські моделі ШІ змінюють баланс сил у сфері штучного інтелекту.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.