Система SuperNODE поєднує 32 прискорювачі AMD Instinct MI210 в одному сервері, використовуючи структуру пам’яті GigaIO FabreX PCIe із низькою затримкою. Про це повідомляє Network World.
Компанія GigaIO, яка спеціалізується на інфраструктурі штучного інтелекту й технічних обчислень, прагне спростити встановлення та конфігурацію високопродуктивних обчислювальних систем (HPC).
Постачальник нещодавно анонсував автономну одновузлову систему із 32 налаштованими графічними процесорами, щоб запропонувати спрощене розгортання ШІ та суперкомп’ютерних ресурсів.
До цього часу єдиним способом використовувати 32 GPU була наявність чотирьох серверів із вісьмома GPU на кожному. Доведеться боротися із затримкою, оскільки сервери спілкуються через мережеві протоколи й усе це обладнання займатиме простір.
Особливість пристрою GigaIO під назвою SuperNODE полягає у тому, що він пропонує вибір графічних процесорів: до 32 графічних процесорів AMD Instinct MI210 або 24 графічних процесорів NVIDIA A100, а також до 1 ПБ пам’яті на одному готовому сервері.
Однак MI210 є кроком назад за продуктивністю порівняно з топовою платою MI250 (принаймні на цей момент), яка використовується в суперкомп’ютері Frontier exaFLOP. Він має трохи менше ядер і менше пам’яті, але все ще базується на технології AMD Radeon GPU.
Система SuperNODE, створена компанією GigaIO й оснащена прискорювачами AMD Instinct, пропонує переконливі TCO як для традиційних HPC, так і для генеративних робочих навантажень ШІ.
SuperNODE побудовано на основі спеціальної технології GigaIO FabreX, орієнтованої на пам’ять структури, яка зменшує затримку системної пам’яті одного сервера, який спілкується з іншими серверами в системі, лише до 200 нс. Це дає змогу реалізації FabreX Gen4 збільшити пропускну здатність до 512 Гбіт/с.
FabreX може підключати різноманітні ресурси, включно з такими прискорювачами, як графічні процесори, DPU, TPU, FPGA та SoC; пристрої зберігання, наприклад NVMe, власне сховище PCIe й інші ресурси введення/виведення, підключені до обчислювальних вузлів.
SuperNODE може запускати наявні програми, написані на популярних фреймворках ШІ, таких як PyTorch і TensorFlow, без необхідності модифікації.
Він використовує програмне забезпечення Nvidia Bright Cluster Manager Data Science для керування та налаштування середовища і планування, а також керування контейнерами.
SuperNODE вже доступний у GigaIO.