NVIDIA представила найпотужніший чип у світі – Blackwell B200, який відкриє шлях до гігантських нейронних мереж

Компанія NVIDIA на конференції GTC 2024 представила ШI-прискорювачі наступного покоління на GPU з архітектурою Blackwell, повідомляє TechNewsSpace.

За словами виробника, майбутні прискорювачі штучного інтелекту дозволять створювати ще більші нейронні мережі, включаючи роботу з великими мовними моделями (LLM) із трильйонами параметрів, і водночас будуть до 25 разів енергоефективнішими й економічнішими.

Архітектура графічного процесора Blackwell названа на честь американського математика Девіда Гарольда Блеквелла і включає низку інноваційних технологій прискорення обчислень.

Вони допоможуть досягти прориву в обробці даних, інженерному моделюванні, автоматизації проєктування електроніки, автоматизованому проєктуванні ліків, квантових обчисленнях і генеративному штучному інтелекті.

«Генеративний ШІ є визначальною технологією нашого часу. Графічні процесори Blackwell – це двигун наступної промислової революції», – підкреслив генеральний директор NVIDIA Дженсен Хуанг під час презентації.

Виробник без зайвої скромності називає графічний процесор NVIDIA B200 найпотужнішим чипом у світі. В обчисленнях FP4 і FP8 новий GPU забезпечує продуктивність до 20 і 10 флопс відповідно.

Новий GPU складається із двох кристалів, які виготовлені за спеціальною версією 4-нм техпроцесу TSMC 4NP і поєднані з корпусом 2.5D CoWoS-L. Це перший графічний процесор NVIDIA із компонуванням мікросхем.

Чипи з’єднані шиною NV-HBI із пропускною здатністю 10 ТБ/с і працюють як єдиний GPU. Всього в новинці 208 мільярдів транзисторів.

З боків від кристалів GPU розташовані вісім стеків пам’яті HBM3e загальною ємністю 192 ГБ. Його пропускна здатність досягає 8 ТБ/с. А щоб об’єднати кілька прискорювачів Blackwell в одній системі, новий GPU отримав підтримку інтерфейсу NVLink п’ятого покоління, який забезпечує пропускну здатність до 1,8 ТБ/с в обох напрямках. За допомогою цього інтерфейсу (перемикач NVSwitch 7.2T) можна об’єднати до 576 GPU в один пакет.

Одним з основних джерел підвищення продуктивності B200 стали нові тензорні ядра і друге покоління Transformer Engine. Останній навчився більш тонко підбирати необхідну точність обчислень для тих чи інших завдань, що впливає як на швидкість навчання та роботи нейронних мереж, так і на максимальний обсяг підтримуваних LLM.

Тепер NVIDIA пропонує навчання AI у форматі FP8, а FP4 достатньо для запуску навчених нейронних мереж. Але зауважте, що Blackwell підтримує широкий спектр форматів, включно з FP4, FP6, FP8, INT8, BF16, FP16, TF32 і FP64.

Флагманським прискорювачем на новій архітектурі стане суперчип NVIDIA Grace Blackwell, який поєднує в собі пару графічних процесорів B200 і процесор NVIDIA Grace central Arm із 72 ядрами Neoverse V2. Цей прискорювач має половину ширини серверної стійки й TDP до 2,7 кВт.

Продуктивність в операціях FP4 досягає 40 флопс, тоді як в операціях FP8/FP6/INT8 новий GB200 здатний забезпечити 10 флопс.

Як зазначає сама NVIDIA, новий продукт забезпечує 30-кратне збільшення продуктивності порівняно з NVIDIA H100 для робочих навантажень, пов’язаних із великими мовними моделями. Він до 25 разів економічніший та енергоефективніший.

Багато виробників незабаром представлять свої системи на базі NVIDIA B200, включно з Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn і ZT Systems.

NVIDIA GB200 є частиною платформи NVIDIA DGX Cloud. Пізніше цього року рішення на цьому суперчипі будуть доступні від основних хмарних постачальників, включно з AWS, Google Cloud та Oracle Cloud.

Раніше ProIT повідомляв, що NVIDIA представила нові процесори RTX 500 і 1000 для ноутбуків з ШІ.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!