Графічні процесори користуються великим попитом і є критично важливими для роботи та навчання генеративних моделей ШІ. Сектор альтернативних хмар, також відомий як мікрохмари, переживає сплеск популярності, повідомляє InfoWorld.
Такі компанії, як CoreWeave, Lambda Labs, Voltage Park і Together AI, перебувають в авангарді цього руху. CoreWeave, яка починалася як підприємство з майнінгу криптовалюти, стала основним постачальником інфраструктури GPU.
Ця зміна ілюструє ширшу тенденцію: компанії все більше покладаються на хмарні послуги GPU здебільшого через високу вартість і технічні вимоги встановлення й обслуговування необхідного обладнання на місці. Оскільки постачальники публічних хмар не знижують ці обчислювальні послуги, мікрохмари пропонують кращий шлях для багатьох підприємств.
Чому б не дотримуватися традиційних хмарних сервісів, які надають AWS, Google Cloud і Microsoft Azure, що також пропонують низку ресурсів GPU? Відповідь, як завжди, – гроші.
Мікрохмари часто є більш економічно ефективним рішенням для проєктів ШІ, які вимагають графічних процесорів. Вартість оренди популярних графічних процесорів, таких як NVIDIA A100 40GB, може бути значно нижчою на CoreWeave або іншої мікрохмарної платформи порівняно з Azure або Google Cloud (перевірте поточні ціни, адже це дуже загальне спостереження).
Незважаючи на жвавість цього сектору, життєздатність цих постачальників залежить від стабільного постачання графічних процесорів у великих кількостях і за конкурентними цінами.
У зв’язку з тим, що великі постачальники хмарних технологій інвестують у спеціальне обладнання для обробки штучного інтелекту, конкурентний тиск може посилитися і проявлятися у вигляді нижчих цін, що збереже конкурентоспроможність великих хмарних постачальників.
Крім того, хоча графічні процесори наразі є кращими для генеративних завдань штучного інтелекту через їхню швидкість і здатність виконувати багато завдань одночасно, не всі робочі навантаження штучного інтелекту вимагають використання графічних процесорів. Графічні процесори є надмірними для більшості генеративних робочих навантажень ШІ. Сьогодні вони часто є більше символом статусу, аніж необхідністю.
Центральні процесори все ще можна використовувати для менш чутливих до часу завдань, де більш повільний темп прийнятний. Деякі багатообіцяючі нові GPU-подібні процесори перебувають у розробці. Вони можуть запропонувати більш цілеспрямовану обробку для генеративного штучного інтелекту за нижчою ціною, ніж поточні GPU.
Основна мета використання будь-якого ресурсу, включно з процесорами, полягає в тому, щоб зробити якнайбільше із найменшими витратами. У більшості випадків витрати на використання штучного інтелекту повернуть багато підприємств до реальності, а ажіотаж спаде.
Однак найближчі перспективи мікрохмар оптимістичні. Аналітики очікують, що сфера генеративного ШІ продовжить стимулювати попит, що має сприяти створенню хмарних стартапів штучного інтелекту, орієнтованих на GPU.
Ці нові учасники можуть запропонувати жорстку конкуренцію відомим хмарним гравцям. Особливо для клієнтів, які готові використовувати нові та дешевші технології для керування своїми мультихмарними середовищами. Підприємства борються з високою вартістю хмари, яка перевищує їхні бюджети. Дешевша альтернатива буде вельми бажаною.
Майже два десятиліття тому на ринку хмарних обчислень почали з’являтися основні гравці. У період із 2012 до 2016 років із трьох десятків хмарних компаній лишилося небагато, оскільки ринок хмарних технологій нормалізувався. Очікується, що те саме станеться і тут.
Читайте також на ProIT: Як зрозуміти, що ваш графічний процесор «помирає»? Шість ознак.
Раніше ми повідомляли, що NVIDIA представила найпотужніший чип у світі – Blackwell B200, який відкриє шлях до гігантських нейронних мереж.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!