Современная электроника №6/2025

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 42 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 Таким образом, XCD обеспечива- ют вычислительную мощность, IOD управляют вводом-выводом и памя- тью, а Infinity Fabric объединяет все эти элементы в общий вычислитель- ный модуль [49, 50]. Ускорительный модуль AMD Instinct MI300X может работать в различных форматах с различной производи- тельностью: FP8 – 2,6 петафлопс; FP16/ BF16 – 1,3 петафлопс; FP32 – 163 тера­ флопс; FP64 – 82 терафлопса. Значительно увеличить произ- водительность и память можно за счёт платформы AMD Instinct MI300X Platform, которая состоит из вось- ми ускорительных модулей Instinct MI300X, размещённых в крэйте Universal Baseboard – UBB 2.0 (рис. 10). В такой конфигурации восемь моду- лей Instinct MI300X работают в фор- мате OAM (Open Accelerator Module), в котором каждый ускоритель напря- мую соединён с другим. Этот режим поддерживает 7 связей Infinity Fabric на каждый ускоритель (128 Гбайт/с каждая) и 8 подключений PCIe Gen 5 для связи с сервером. Общая пропуск- ная способность между всеми ускори- телями составляет 896 Гбайт/с. Внутри каждого ускорителя 8 вычислитель- ных чипов работают параллельно. На уровне платформы все 8 ускорителей видят друг друга как единую систему. Основные характеристики платфор- мы AMD Instinct MI300X Platform при- ведены в табл. 5. Открытая программная экосисте- ма ROCm 6 позволяет пользователям разрабатывать и адаптировать свои программы, используя такие попу- лярные фреймворки, как PyTorch, TensorFlow, JAX. Текущая версия открытого про- граммного стека AMD ROCm 6.1 вклю- чает драйверы, инструменты разра- ботки и API для программирования GPU от низкоуровневых ядер до конеч- ных пользовательских приложений ROCm. Кроме того, она предоставля- ет расширенную поддержку несколь- ких GPU для создания масштабируе- мых AI-систем [53]. Платформа AMD Instinct MI300X Platform может обучать модели с триллионами параметров, распре- деляя обработку между всеми 2432 вычислительными блоками (304×8). Благодаря огромной параллельной вычислительной мощности эта платформа позволяет также созда- вать большие мультимодальные модели ИИ с генерацией текстов, изображений и видео в реальном времени. Безусловно, нужно обратить внима- ние на цены продукции AMD. Один ускорительный модуль Instinct MI300X (192 Гбайт HBM3) обойдётся корпо- ративным заказчикам, таким как Microsoft, примерно по цене $10 000 за единицу. Для других, менее важных корпора- тивных клиентов цена может соста- вить около $15 000 за единицу Instinct MI300X [54]. Полная платформа Instinct MI300X Platform MI300X (8 ускорительных модулей + крэйт UBB 2.0) стоит ори- ентировочно в районе $34 000 [55]. Эти цифры позволяют говорить о том, что ускорительные модули AMD Instinct MI300X значительно дешевле аналогичной продукции того же клас- са B200 NVIDIA. При этом AMD предлагает больше памяти (192 Гбайт против 80–192 Гбайт у конкурентов) и открытую программ- ную экосистему ROCm 6. Кроме того, Instinct MI300X имеет лучшие показатели по энергоэффек- тивности (TBP – 750 Вт на ускоритель- ный модуль). Приведённые выше данные показы- вают, что AMD Instinct M1300X может составить серьёзную конкуренцию, отбирая у NVIDIA таких клиентов, как: Microsoft, Azure, Meta, Oracle Cloud, Google, Amazon, Hugging Face, которые начали интегрировать Instinct MI300X в свои инфраструктуры искусственно- го интеллекта [56, 57]. Семейство AMD Instinct MI300X/ MI325X представляет собой серьёз- ную попытку бросить вызов доми- нированию NVIDIA в области ИИ-ускорителей. Благодаря револю- ционной 3.5D-архитектуре, рекордно- му объёму памяти и стратегическим партнёрствам с ведущими техноло- гическими компаниями AMD демон- стрирует, что конкуренция в сфере аппаратного обеспечения искусствен- ного интеллекта становится всё более интенсивной. Особенно впечатляющими выгля- дят планы AMD в отношении новой модели MI355X с заявленным 35-крат- ным улучшением производительно- сти инференса и поддержкой новых низкоточных форматов FP4/FP6. Они будут оснащены 256 Гбайт памя- ти HBM3E и обеспечат пропускную способность памяти до 6 Тбайт/с. AMD видит большой потенциал в рынке Рис. 10. Платформа AMD Instinct™ MI300X Platform [51] Таблица 5. Основные характеристики платформы AMD Instinct MI300X Platform [52] Наименование Значение Количество ускорителей 8 штук в одной системе AMD MI300X Platform Общий объём памяти 1,5 Тбайт HBM3 Скорость памяти 5,3 Тбайт/с Производительность ИИ 42 Пфлопс (FP8) Потребление энергии 750 Вт на ускоритель Соединение между чипами 896 Гбайт/с Подключение к серверу PCIe Gen 5 x16

RkJQdWJsaXNoZXIy MTQ4NjUy