Компанія NVIDIA на конференції GTC 2024 представила ШI-прискорювачі наступного покоління на GPU з архітектурою Blackwell, повідомляє TechNewsSpace.
За словами виробника, майбутні прискорювачі штучного інтелекту дозволять створювати ще більші нейронні мережі, включаючи роботу з великими мовними моделями (LLM) із трильйонами параметрів, і водночас будуть до 25 разів енергоефективнішими й економічнішими.
Архітектура графічного процесора Blackwell названа на честь американського математика Девіда Гарольда Блеквелла і включає низку інноваційних технологій прискорення обчислень.
Вони допоможуть досягти прориву в обробці даних, інженерному моделюванні, автоматизації проєктування електроніки, автоматизованому проєктуванні ліків, квантових обчисленнях і генеративному штучному інтелекті.
«Генеративний ШІ є визначальною технологією нашого часу. Графічні процесори Blackwell – це двигун наступної промислової революції», – підкреслив генеральний директор NVIDIA Дженсен Хуанг під час презентації.
Виробник без зайвої скромності називає графічний процесор NVIDIA B200 найпотужнішим чипом у світі. В обчисленнях FP4 і FP8 новий GPU забезпечує продуктивність до 20 і 10 флопс відповідно.
Новий GPU складається із двох кристалів, які виготовлені за спеціальною версією 4-нм техпроцесу TSMC 4NP і поєднані з корпусом 2.5D CoWoS-L. Це перший графічний процесор NVIDIA із компонуванням мікросхем.
Чипи з’єднані шиною NV-HBI із пропускною здатністю 10 ТБ/с і працюють як єдиний GPU. Всього в новинці 208 мільярдів транзисторів.
З боків від кристалів GPU розташовані вісім стеків пам’яті HBM3e загальною ємністю 192 ГБ. Його пропускна здатність досягає 8 ТБ/с. А щоб об’єднати кілька прискорювачів Blackwell в одній системі, новий GPU отримав підтримку інтерфейсу NVLink п’ятого покоління, який забезпечує пропускну здатність до 1,8 ТБ/с в обох напрямках. За допомогою цього інтерфейсу (перемикач NVSwitch 7.2T) можна об’єднати до 576 GPU в один пакет.
Одним з основних джерел підвищення продуктивності B200 стали нові тензорні ядра і друге покоління Transformer Engine. Останній навчився більш тонко підбирати необхідну точність обчислень для тих чи інших завдань, що впливає як на швидкість навчання та роботи нейронних мереж, так і на максимальний обсяг підтримуваних LLM.
Тепер NVIDIA пропонує навчання AI у форматі FP8, а FP4 достатньо для запуску навчених нейронних мереж. Але зауважте, що Blackwell підтримує широкий спектр форматів, включно з FP4, FP6, FP8, INT8, BF16, FP16, TF32 і FP64.
Флагманським прискорювачем на новій архітектурі стане суперчип NVIDIA Grace Blackwell, який поєднує в собі пару графічних процесорів B200 і процесор NVIDIA Grace central Arm із 72 ядрами Neoverse V2. Цей прискорювач має половину ширини серверної стійки й TDP до 2,7 кВт.
Продуктивність в операціях FP4 досягає 40 флопс, тоді як в операціях FP8/FP6/INT8 новий GB200 здатний забезпечити 10 флопс.
Як зазначає сама NVIDIA, новий продукт забезпечує 30-кратне збільшення продуктивності порівняно з NVIDIA H100 для робочих навантажень, пов’язаних із великими мовними моделями. Він до 25 разів економічніший та енергоефективніший.
Багато виробників незабаром представлять свої системи на базі NVIDIA B200, включно з Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn і ZT Systems.
NVIDIA GB200 є частиною платформи NVIDIA DGX Cloud. Пізніше цього року рішення на цьому суперчипі будуть доступні від основних хмарних постачальників, включно з AWS, Google Cloud та Oracle Cloud.
Раніше ProIT повідомляв, що NVIDIA представила нові процесори RTX 500 і 1000 для ноутбуків з ШІ.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!