ProIT: медіа для профі в IT
2 хв

Розробку DeepSeek R2 блокує дефіцит графічних процесорів Nvidia

author avatar ProIT NEWS

Найбільша китайська компанія у сфері штучного інтелекту DeepSeek Ltd. змушена відкласти запуск своєї нової моделі R2 для логічного міркування через нестачу графічних процесорів Nvidia, повідомляє The Information із посиланням на анонімні джерела.

За даними джерел, CEO компанії Лян Венфен незадоволений поточним станом розробки моделі, але її покращення неможливе без масштабніших обчислювальних ресурсів. DeepSeek уже кілька місяців працює над R2, але зіткнулася з обмеженням потужностей.

Модель R1: гучний успіх з обмеженими ресурсами

Модель R1, представлена на початку року, викликала значний резонанс завдяки ефективності, порівняній з моделями OpenAI, Anthropic та Meta, попри значно нижчі витрати на її тренування.

R1 була натренована на кластері з 50 000 GPU Hopper, серед яких приблизно:

• 10 000 — H100,

• 10 000 — H800,

• 30 000 — H20 (створені спеціально для китайського ринку).

Офіційно китайські компанії не можуть придбати H100 або H800, тож, імовірно, DeepSeek отримала частину цих чипів через інвестора High-Flyer Capital Management або за допомогою підставних компаній, які мали доступ до публічної хмари. H20 були закуплені легально, але зараз їх експорт також заборонений через санкції США, запроваджені у квітні.

Обмеження вже впливають на роботу R1

За даними The Information, багато H20 уже задіяні клієнтами DeepSeek — китайськими компаніями та держустановами, які розгортають R1 у хмарі. Це вичерпує ресурси для навчання R2, а також починає обмежувати можливості самої R1.

Аналітики вважають, що покращення R2 призведе до ще більшого попиту, який може перевищити пропускну здатність китайських хмарних провайдерів.

«Якщо ці повідомлення правдиві — це може стати суттєвим ударом для DeepSeek. Якщо компанія не оновлюватиме моделі регулярно, її продукти стануть менш точними, ніж у конкурентів», — коментує Голгер Мюллер (Constellation Research Inc.).

Водночас він зазначає, що інженери DeepSeek уже демонстрували високу креативність, і не виключено, що зможуть подолати ці обмеження.

H20 — заблокований аналог H100 з обмеженою функціональністю

Процесор H20 технічно близький до H100, але його пропускна здатність і функціональність зменшені відповідно до попередніх обмежень. У квітні 2024 року адміністрація Дональда Трампа заборонила навіть цей чип для експорту в Китай.

Альтернативи на внутрішньому ринку, зокрема Ascend 910B від Huawei, ще менш потужні й не сумісні з архітектурою Nvidia CUDA, яка використовується для оптимізації ШІ-моделей. Це особливо критично, оскільки більшість китайських компаній використовують CUDA, а моделі DeepSeek R1 і R2 теж оптимізовані під Nvidia.

Таким чином, втрата доступу до чипів Nvidia загрожує сповільненням або навіть зупинкою подальшого розвитку DeepSeek.

Читайте також на ProIT: DeepSeek-R1-0528: китайська відповідь на OpenAI o3 і Google Gemini у форматі open source.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!

Приєднатися до company logo
Продовжуючи, ти погоджуєшся з умовами Публічної оферти та Політикою конфіденційності.