Современная электроника №6/2025

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 36 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 ряд изменений в архитектуре позво- лил заметно улучшить его параметры. Прежде всего, использована новая 12-слойная HBM3E память B300 Blackwell Ultra объёмом 288 Гбайт. Это критично для работы с крупнейшими языковыми моделями, которые имеют триллионы параметров [16]. Кроме того, B300 может работать с производительностью до 15 петафлопс в формате FP4. Однако при этом увели- чилась мощность до 1400 Вт (TDP) [17]. В отличие от B200, которые ком- плектуются ConnectX-7 (до 400 Гбит/с), B300 использует ConnectX-8, где NVIDIA интегрировала дополнительные функ- ции в сетевой интерфейс, уменьшив таким образом зависимость от сторон- них чипов (например, PCIe Retimer). Ускоритель ГП B300 разработан в новом конструктиве, получившем название SXM Puck благодаря тому, что по форме напоминает шайбу (Puck). Он объединяет УГП, высоко- скоростную память HBM3e и другие компоненты в компактный, высокоэф- фективный блок, который легко инте- грируется в серверные системы. Этот модуль позволяет легко соби- рать, заменять или обновлять УГП в серверах, как конструктор LEGO. Модуль можно также вставить в боль- шую систему, например, NVIDIA HGX, DGX или GB300 NVL72. Такой подход значительно упрощает создание и ремонт мощных ИИ-кластеров. Увеличение мощности потребова- ло использования в конструктиве SXM Puck оптимизированного жидкостно- го охлаждения. В этой новой схеме используются жидкостные охлажда- ющие пластины для прямого отвода тепла от B300, а также усовершенство- ванные разъёмы UQD (Universal Quick Disconnect), предназначенные для быстрого подключения системы охлаж- дения. Специальные стойки с перепро- ектированными каналами охлаждения позволяют разместить больше УГП в кластере, а также интегрировать моду- ли в такие системы, как NVIDIA MGX. Платформа HGX B200 представля- ет собой первую ступеньку в линей- ке систем масштабирования устройств на основе ускорителей ГП Nvidia. Одна- ко сама по себе HGX B200 – это свое- го рода основа будущего устройства, в которой нет центрального процессо- ра CPU, но есть посадочные места под них, а также под другую периферию. Отсутствие в комплекте поставки центрального процессора объясняется тем, что это даёт заказчикам возмож- ность подобрать CPU под свои конкрет- ные задачи с необходимой именно им архитектурой. Поэтому партнёрские компании, такие как, например, Supermicro, ASUS, Lenovo или DataCrunch, добавляют CPU, память и другие необходимые ком- плектующие детали. Как правило, HGX B200 комплектуется CPU Intel Xeon 6 6900 или AMD EPYC серии 9004/9005 [18]. Наиболее распространённый и стан- дартный вариант платформы HGX B200, предназначенный для макси- мальной производительности в зада- чах ИИ, обучения моделей и инферен- са, включает восемь УГП NVIDIA B200. Ключевой особенностью HGX B200 является использование NVLink 5.0 с пропускной способностью 1,8 Тбайт/с между ускорителями. Это позволяет всем восьми B200 функционировать как единый вычислительный ком- плекс, превосходящий по техниче- ским возможностям традиционные структуры с PCIe-соединениями. Платформа HGX B200 поддерживает воздушное или жидкостное охлажде- ние (например, в Lenovo ThinkSystem SR780a V3 с водяным охлаждением Lenovo Neptune). Конфигурация 8×B200 представляет собой оптимальный вариант для обучения больших язы- ковых моделей (LLM), аналитики дан- ных и выполнения сверхсложных гло- бальных вычислительных задач [19]. Платформа NVIDIA Blackwell HGX B200 заметно превосходит предше- ствовавшую модель NVIDIA HGX H100 по базовым параметрам: ● 15-кратное увеличение скорости ин- ференса в реальном времени; ● 12-кратное снижение стоимости экс- плуатации и энергопотребления; ● 3-кратное ускорение обучения боль- ших языковых моделей благодаря движку Transformer Engine второго поколения с форматом FP8 [8]. Платформа HGX B200 поддержива- ет современные сетевые технологии NVIDIA, включая NVIDIA BlueField-3 B3140H VPI 400GbE и NVIDIA ConnectX-7 NDR OSFP400 InfiniBand. Кроме того, использование NVIDIA Quantum-2 InfiniBand и Spectrum-X Ethernet позво- ляет работать с сетевыми скоростями до 400 Гбит/с, обеспечивая эффектив- ное масштабирование на уровне дата- центра. Для менее требовательных задач или компактных систем, где не нуж- на такая высокая производительность, разработаны варианты с меньшим количеством ускорителей графиче- ских процессоров (1, 2, 4) [20]. В табл. 2 приведены варианты кон- фигураций HGX B200 с разными коли- чествами УГП для CPU серий Intel Xeon 6 6900 и AMD EPYC 9004/9005 [21]. Важно подчеркнуть, что выбор того или иного CPU определяется количе- ством линий PCIe 5.0, необходимых для поддержки 1, 2, 4 и 8 ускорителей графических процессоров B200. Платформу NVIDIA HGX B300 на базе рассмотренного выше нового УГП Blackwell Ultra SXM NVIDIA планирует выпустить в коммерческую продажу во второй половине 2025 года. Деталь- ной технической информации пока нет. На сайте NVIDIA приведены толь- ко сравнительные технические харак- теристики HGX B300 и HGX B200, кото- рые показаны в табл. 3. Использование нового ускорителя ГП позволило значительно улучшить такие параметры HGX B300, как FP4 Tensor Core, INT8 Tensor Core, FP64/FP64 Tensor Core, общую память, пропуск- ную способность сети. Для ускорения вычислений и гене- ративного ИИ, кроме NVLink, исполь- зованы высокоскоростные соединения InfiniBand, Spectrum-X Ethernet. Поми- мо того, HGX B300 оснащён NVIDIA BlueField-3 DPUs, который предназна- Таблица 2. Варианты конфигураций HGX B200 с разными количествами УГП B200, шт. CPU RAM (ГБ) Память HBM3e (ГБ) Количество необходимых линий PCIe 5.0 1 1x Intel Xeon 6960P (72 ядра) 250 180 16–32 1 1x AMD EPYC 9124 (16 ядер) 250 180 16–32 2 1x Intel Xeon 6952P (96 ядер) ~500 360 32–64 2 1x AMD EPYC 9224 (24 ядра) ~500 360 32–64 2 2x Intel Xeon 6952P (96 ядер каждый) ~500 360 64–128 2 2x AMD EPYC 9224 (24 ядра каждый) ~500 360 64–128 4 2x Intel Xeon 6979P (120 ядер каждый) ~750 720 64–128 4 2x AMD EPYC 9655 (96 ядер каждый) ~750 720 64–128 8 2x Intel Xeon 6980P (128 ядер каждый) ~1000 1440 128–256 8 2x AMD EPYC 9965 (192 ядра каждый) ~1000 1440 128–256

RkJQdWJsaXNoZXIy MTQ4NjUy