Cerebras у 748 разів швидша за суперкомп’ютер Frontier

Компанія Cerebras Systems, виробник чипа зі штучним інтелектом розміром із коробку для піци, зробила кілька вражаючих заяв щодо продуктивності обробки штучного інтелекту.

Як повідомляє NetworkWorld, на нещодавній виставці Supercomputing 24 компанія Cerebras оголосила про прорив у моделюванні молекулярної динаміки.

Дані сторонньої компанії Artificial Analysis показують, що одна система Cerebras CS-2 з одним Wafer Scale Engine-2 (WSE) досягає понад 1,1 мільйона кроків на секунду, що у 748 разів швидше, ніж це можливо на суперкомп’ютері Frontier, який програв титул найшвидшого у світі суперкомп’ютера новачку El Capitan.

Це був один чип WSE в одному серверному блоці CS-2, який займав одну стійку висотою приблизно 16U і споживав 27 кіловат енергії. Frontier має 37 000 графічних і центральних процесорів у рядах шаф і споживає 21 мегават енергії.

Ще більш вражаючим є те, що цей тест проводився на CS-2, який є старішою моделлю Cerebras. Чип CS-3 і WSE третього покоління принаймні вдвічі швидший за CS-2.

Експеримент проводився у партнерстві з Національними лабораторіями Сандіа, Ліверморською національною лабораторією Лоуренса та Лос-Аламоською національною лабораторією.

«Цей новий світовий рекорд означає, що вчені тепер можуть щодня виконувати дворічну роботу з моделювання на основі GPU. Це значно прискорить швидкість інновацій, отриманих завдяки молекулярному моделюванню. Цей важливий прорив надає розуміння структури та функції матеріалу. Коли ми поширимо нашу роботу на біомолекули, це відкриє нові можливості у згортанні білка, медицині та розробленні ліків», — сказав Майкл Джеймс, головний архітектор передових технологій і співзасновник Cerebras Systems.

Розмір Wafer Scale Engine становить 8 на 8 дюймів, що значно більше, ніж графічний процесор розміром від 1 до 1,5 дюйма. Тоді як графічний процесор має близько 5000 ядер, WSE має 850 000 ядер і 40 ГБ вбудованої пам’яті SRAM, що в 10 разів швидше, ніж пам’ять HBM, яка використовується в графічних процесорах. 20 ПБ/с пропускної здатності пам’яті та 6,25 петафлопс обчислювальної потужності на щільних матрицях і 62,5 петафлопс на розріджених матрицях.

В іншому тесті порівняно з моделлю Meta Llama 3.1-405B, яка використовується для навчання генеративного штучного інтелекту, Cerebras виробляв 969 токенів на секунду, значно випереджаючи другий показник, Samba Nova, який генерував 164 токени на секунду. Це робить пропускну здатність Cerebras у 12 разів швидшою, ніж інстанція AI AWS, і в шість разів швидшою, ніж її найближчий конкурент Samba Nova.

Cerebras не приховує секрету свого успіху. За словами Джеймса Ванга, директора з маркетингу продуктів у Cerebras, це гігантський Wafer Scale Engine із 850 000 ядер, які можуть спілкуватися одне з одним на високій швидкості.

Усередині єдиного сервера з вісьмома графічними процесорами вони використовують NVLink для обміну даними, тому їх можна запрограмувати, щоб вони виглядали як один процесор. Але як тільки він виходить за межі восьми графічних процесорів, у будь-якій конфігурації суперкомп’ютера міжз’єднання змінюється з NVLink на InfiniBand або Ethernet і на цьому етапі їх неможливо запрограмувати як єдиний блок.

Раніше Cerebras оголосила, що Sandia National Laboratories розгортає тестовий стенд Cerebras CS-3 для робочих навантажень ШІ.

Система під назвою Kingfisher спочатку буде створена як кластер із чотирьох систем CS-3 і з часом розшириться до восьми систем. Кластер Kingfisher використовуватиметься як у традиційному моделюванні HPC, так і в генеративному ШІ для Міністерства енергетики США.

Раніше ProIT повідомляв, що xAI створить суперкомп’ютер спеціально для роботи свого чат-бота з ШІ Grok.

Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!