Современная электроника №6/2025

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 34 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 Рис. 2. Упрощённая схема архитектуры УГП «Blackwell B200 AI B200 Accelerator» ИИ дата-центров. О доминировании NVIDIA можно судить по объёму про- даж в этом сегменте рынка. Рыночная капитализация (FY) на конец финансо- вого 2025 года (май 2025 года) состав- ляла около трёх с половиной трил- лионов долларов США. Эта цифра сравнима с бюджетами таких разви- тых стран, как, например, Канада. При- чём по сравнению с 2022 годом рост FY составил примерно 230%, что напря- мую связано со взрывным характе- ром развития искусственного интел- лекта [5]. Подробно историю развития этой фирмы и описание всей номенклату- ры выпускаемой продукции можно найти, например, на сайте [6]. Ускоритель NVIDIA B100 AI B200 Accelerator компания NVIDIA пред- ставила в 2024 году в рамках рекла- мы следующего поколения микроар- хитектуры графических процессоров Next-Generation B200 Microarchitecture Blackwell [7]. Имеет смысл пояснить название этого устройства, которое чаще все- го употребляют сами изготовители. Термин «B200 Accelerator» обозначает устройство, которое позволяет увели- чить производительность графическо- го процессора, используя возможности параллельной обработки в дополне- ние к центральному процессору CPU. В англоязычных статьях часто остав- ляют только слово «Accelerator». Одна- ко лучше полностью переводить этот термин как «ускоритель графическо- го процессора» – УГП. Ускоритель графического про- цессора NVIDIA B100 представляет собой базовую версию архитектуры Blackwell, специально разработан- ную для организаций, которые хотят модернизировать свои существующие системы без значительных изменений в инфраструктуре энергоснабжения и охлаждения [8]. Ускоритель ГП B100 выпускает- ся в форм-факторе SXM5, совмести- мом с предыдущей моделью H100 по интерфейсу и мощности потребления (700 Вт), что позволяет использовать его в качестве переходной модели на новую технологию (рис. 1). УГП B100 совместим с предыдущей моделью H100. При этом у B100 производитель- ность (FP8 Tensor) 4500 Тфлопс значи- тельно выше, чем у H100 (2000 Тфлопс для INT8 или 1000 Тфлопс для FP16 Tensor Core) [9]. Специализированный форм-фактор Server PCI Express Module – SXM разра- ботан NVIDIA для высокопроизводи- тельных вычислений в центрах обра- ботки данных. Это модуль с прямым разъёмом, обеспечивающий лучшую подачу питания, охлаждение и более высокую пропускную способность по сравнению с традиционными графи- ческими PCIe-картами. Ускоритель ГП обладает 192 Гбайт памяти HBM3e с пропускной способно- стью до 8 Тбайт/с, что в 2,4 раза превы- шает пропускную способность памяти H100. Эта существенная разница осо- бенно важна для инференса больших языковых моделей, где производитель- ность часто ограничена именно про- пускной способностью памяти [10]. NVIDIA Blackwell B200 AI B200 Accelerator – новый ускоритель графи- ческого процессора, который поступил в коммерческую продажу в 2025 году. Полные физические параметры ново- го ускорителя графического процессо- ра B200 не разглашаются в открытых источниках. Известно только, что этот УГП выполнен в стандарте 6-го поколе- ния NVIDIA Server PCI Express Module – SXM6 [11]. Понять, насколько большой B200, можно по описанию предыдущей модели H100, которая имеет габари- ты 260×110×347 мм и вес 1,7 кг [12]. Новая архитектура Blackwell явля- ется преемником предыдущих версий NVIDIA Hopper и Ada Lovelace, однако отличается от них как по назначению, так и по техническому исполнению [13]. Несмотря на то что версия Hopper (H100/H200) также построена на 4-нм техпроцессе, она рассчитана на мень- шее количество транзисторов: около 80 миллиардов в H100. Для более ясно- го представления о преимуществах Blackwell следует напомнить, что означают используемые в ИИ форма- ты данных. Числовые форматы FP16, FP8, FP4 определяют соответственно 16-битное, 8-битное и 4-битное числа с плавающей точкой. Специальный формат BF16 – это упрощённая версия FP16, разработан- ная для задач ИИ, в которых можно отбрасывать мелкие детали. Другой особый ИИ-формат INT8 предназна- чен для работы с числами без дроб- ной части. Архитектура Blackwell поддержива- ет форматы FP16, FP8, FP4 и INT8, что даёт возможность ускорить вычисле- ния с меньшей точностью, не критич- ной для ИИ. Так, например, Blackwell позволяет достичь 4-кратного приро- ста производительности для инферен- са LLM по сравнению с Hopper, опти- мизированного для FP16 и BF16. Главное архитектурное отличие архитектуры Blackwell, по сравнению с предыдущей версией NVIDIA Hopper H100, заключается в том, что B200 построен по схеме двух кристаллов (Dual-Die), соединённых высокоско- ростным интерфейсом NV-HBI (NVIDIA High Bandwidth Interface), что позволя- ет им функционировать как единый ускоритель ГП. Максимальная площадь кристал- ла для технологии TSMC 4NP состав- ляет примерно 860 мм². В конструк- ции старой версии ускорителя ГП H100 была использована практически вся