Современная электроника №6/2025

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 37 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 чен для гипермасштабируемых обла- ков ИИ. О своих разработках на базе нового HGX B300 сообщили партнёры NVIDIA. Так, 29 апреля 2025 года была опубли- кована информация о NVIDIA HGX B300 NVL16, содержащем шестнадцать B300 [22]. NVIDIA DGX B200 – это полностью готовый к использованию сервер, который включает ускорители гра- фических процессоров Blackwell B200, управляющий процессор x86 и всё необходимое оборудование для работы с различными задачами искусствен- ного интеллекта. Сервер NVIDIA DGX B200 построен на платформе HGX B200 с ускорителями графических процес- соров Blackwell B200 [23]. Полностью готовый к работе сервер DGX B200 имеет в своём составе сер- верный блок HGX B200, процессор x86 CPU, а также всю необходимую пери- ферию. На рис. 3 показан внешний вид материнской серверной платы DGX B200. На рис. 3 цифрами показано следу- ющее. 1. SSD-накопители формата M.2 для ОС сервера (сверху) и BlueField-3 DPU (Data Processing Unit) (снизу) – спе- циальный процессор для обработ- ки сетевого трафика. 2. Интерфейс для подключения допол- нительных плат расширения (сете- вые карты, накопители и др.), разъ- ём PCIe-карт для слотов 2 и 4. 3. Высокоскоростные сетевые модули для соединения серверов в класте- ре, QSFP-трансиверы для внешней сети ConnectX-7. 4. Сетевая карта 100Gb Ethernet (сверху) и сетевое хранилище BlueField-3 DPU (снизу), обеспечивающие подключе- ние к внешней сети и управление се- тевым трафиком. 5. Дополнительные слоты для плат расширения, разъём PCIe-карт для слотов 1 и 3. 6. Оперативная память сервера, 32x 64 Гбайт или 128 Гбайт, модули DIMM общим объёмом до 4 Тбайт. 7. Специализированные сетевые кон- троллеры ConnectX-7 для высокоско- ростной передачи данных между ускорителями ГП. 8. Центральная плата, которая соеди- няет все компоненты сервера и обе- спечивает их питанием. 9. Специальные кабели DensiLink для подключения внутренних сетевых карт к внешним разъёмам сервера. 10.Два CPU-процессора, которые управля- ют всей системой и координируют ра- боту ускорителей ГП (обычно 2x Intel Xeon 6980P или 2x AMD EPYC 9965). Основные технические характери- стики NVIDIA DGX B200 приведены в табл. 4 [24]. В наиболее распространённом стан- дартном варианте – сервер, объединя- ющий восемь ускорителей ГП NVIDIA Blackwell B200, соединённых NVLink пятого поколения. По сравнению с системами преды- дущего поколения DGX B200 обеспечи- вает 3-кратное увеличение произво- дительности обучения и 15-кратное ускорение инференса. Этот сервер DGX B200 имеет производительность до 72 петафлопс. Общий объём B200- памяти составляет 1440 Гбайт, что позволяет работать с моделями, содер- жащими триллионы параметров. Важнейшим преимуществом DGX B200 является наличие встроенного полного программного стека NVIDIA AI Enterprise, включая NVIDIA Base Command и обширную экосистему поддержки третьих сторон. Это превращает DGX B200 в готовое к использованию решение, не требую- щее дополнительной интеграции про- граммного обеспечения [25]. В некоторых ситуациях полезной может оказаться поддержка совре- менных форматов сжатия (LZ4, Snappy, Deflate), а также функция ускорения полного конвейера запросов к базам данных. Из других важных функциональ- ных возможностей DGX B200 следу- ет отметить систему надёжности и диагностики RAS Engine (Reliability, Availability, Serviceability), которая обе- спечивает: предиктивное управление, Таблица 3. Сравнительные технические характеристики B300 и B200 Наименование HGX B300 HGX B200 Форм-фактор 8x NVIDIA Blackwell Ultra SXM 8x NVIDIA Blackwell SXM FP4 Tensor Core** 144 Пфлопс / 105 Пфлопс 144 Пфлопс / 72 Пфлопс FP8/FP6 Tensor Core* 72 Пфлопс 72 Пфлопс INT8 Tensor Core* 72 Пфлопс 72 Пфлопс FP16/BF16 Tensor Core* 36 Пфлопс 36 Пфлопс TF32 Tensor Core* 18 Пфлопс 18 Пфлопс FP32 600 Тфлопс 600 Тфлопс FP64/FP64 Tensor Core 10 Тфлопс 296 Тфлопс Общая память До 2,3 Тбайт 1,4 Тбайт NVLink Пятое поколение Пятое поколение NVIDIA NVSwitch™ NVLink 5 Switch NVLink 5 Switch Пропускная способность NVSwitch GPU-to-GPU 1,8 Тбайт/с 1,8 Тбайт/с Общая пропускная способность NVLink 14,4 Тбайт/с 14,4 Тбайт/с Пропускная способность сети 1,6 Тбайт/с 0,8 Тбайт/с Увеличение производительности с учётом Attention Performance 2x 1x *С разреженностью **С разреженностью / без разреженности Рис. 3. Материнская плата сервера DGX B200 (пояснения приведены в тексте)

RkJQdWJsaXNoZXIy MTQ4NjUy