NVIDIA презентувала платформу Rubin — нове покоління суперкомп’ютера для навчання та інференсу штучного інтелекту. Анонс відбувся під час CES 2026. Компанія позиціонує Rubin як фундамент для наступного покоління ШІ, здатний радикально зменшити час тренування моделей і вартість обчислень.
Платформа Rubin — це спільно спроєктований комплекс із шести нових чипів: CPU Vera, GPU Rubin, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU і Spectrum-6 Ethernet Switch.
За словами фахівців NVIDIA, така конфігурація забезпечує до 10 разів нижчу вартість інференсу і токенів порівняно з попередньою платформою Blackwell. Для навчання моделей Mixture-of-Experts (MoE) Rubin потребує у 4 рази менше GPU, а мережа Spectrum-X Ethernet дає 5-разове зростання енергоефективності.
«Rubin з’являється саме тоді, коли попит на обчислювальні ресурси для ШІ стрімко зростає», — зазначив Дженсен Хуанг, підкресливши щорічний цикл оновлення ШІ-суперкомп’ютерів та екстремальне спільне проєктування шести чипів як ключ до стрибка продуктивності.
Шосте покоління NVLink забезпечує високошвидкісний, безперебійний обмін між GPU, критично важливий для великих MoE-моделей. Кожен GPU має пропускну здатність 3,6 ТБ/с, а стійка Vera Rubin NVL72 — 260 ТБ/с, що, за твердженням компанії, перевищує сумарну пропускну здатність усього інтернету.
CPU Vera, орієнтований на агентне мислення, побудований на 88 ядрах Olympus, сумісний з Armv9.2 та підтримує NVLink-C2C. GPU Rubin із Transformer Engine третього покоління та апаратно прискореним адаптивним стисненням забезпечує 50 петафлопс NVFP4 для ШІ.
Платформа Vera Rubin NVL72 стала першою системою у форматі стійки NVIDIA з Confidential Computing, що захищає дані на рівнях CPU, GPU і NVLink.
Друге покоління механізмів RAS охоплює процесори й міжз’єднання, забезпечуючи перевірку справності в реальному часі, відмовостійкість і проактивне обслуговування. Модульна безкабельна конструкція лотків дає можливість збирати та сервісувати систему до 18 разів швидше, ніж Blackwell.
NVIDIA пропонує Vera Rubin NVL72 як єдину захищену систему із 72 GPU і 36 CPU, з’єднаних NVLink 6, мережевими картами ConnectX-9 і процесорами BlueField-4. Також доступна серверна плата HGX Rubin NVL8 із вісьмома GPU через NVLink для генеративних ШІ-платформ на базі x86.
Платформа Rubin уже у виробництві. Перші продукти очікуються у другій половині 2026 року. Серед партнерів і ранніх користувачів заявлені AWS, Google Cloud, Microsoft, Oracle, CoreWeave, Meta, OpenAI, Anthropic і xAI.
Раніше ми повідомляли, що NVIDIA розглядає можливість повернення у виробництво відеокарти GeForce RTX 3060.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!