Microsoft оголосила про запуск нового чипа Maia 200, який компанія позиціонує як високопродуктивне кремнієве рішення для масштабування AI inference — виконання вже навчених моделей.
Maia 200 є наступником чипа Maia 100, презентованого у 2023 році. За словами фахівців Microsoft, новинка оптимізована для запуску великих AI-моделей із вищою швидкістю та енергоефективністю. Чип містить понад 100 мільярдів транзисторів і забезпечує більше ніж 10 петафлопс продуктивності у 4-бітній точності та майже 5 петафлопс у 8-бітному режимі, що суттєво перевищує показники попереднього покоління.
Inference — це етап обчислень, на якому модель виконується, на відміну від тренування, що потребує значно більших ресурсів. У міру зрілості AI-компаній саме витрати на inference стають дедалі вагомішою частиною операційних витрат, що стимулює інтерес до оптимізації цього процесу.
У Microsoft розраховують, що Maia 200 допоможе знизити енергоспоживання та підвищити стабільність роботи AI-систем.
«На практиці один вузол Maia 200 може без зусиль запускати найбільші сучасні моделі, маючи значний запас для ще масштабніших моделей у майбутньому», — зазначили в компанії.
Новий чип також вписується у ширший тренд, коли технологічні гіганти переходять до власних розробок кремнію, зменшуючи залежність від NVIDIA, GPU якої стали критично важливими для AI-індустрії.
Google використовує власні TPU (tensor processing units), доступні через хмарні сервіси, а Amazon розвиває лінійку AI-прискорювачів Trainium (останню версію Trainium3 було випущено у грудні). У цих випадках власні чипи дають можливість зняти частину навантаження з GPU NVIDIA і знизити сукупну вартість інфраструктури.
З Maia Microsoft позиціонує себе як прямого конкурента вказаним альтернативам. У пресрелізі компанія повідомила, що Maia 200 забезпечує утричі вищу FP4-продуктивність, аніж чипи Amazon Trainium третього покоління, а також перевищує FP8-показники сьомого покоління TPU від Google.
У Microsoft додали, що Maia вже використовується для роботи AI-моделей команди Superintelligence всередині компанії, а також для підтримки Copilot — фірмового чатбота. Станом на понеділок Microsoft запросила до роботи із SDK Maia 200 широке коло учасників, зокрема розробників, академічні установи та frontier AI-лабораторії.
Раніше ми повідомляли, що Microsoft планує замінити більшість GPU AMD і NVIDIA власними чипами.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!