Современная электроника №6/2025
СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 41 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 Кроме того, NVIDIA разработала мно- жество приложений для разработчи- ков, таких, например, как Omniverse, Omniverse Cloud [43], DRIVE, DRIVE AGX [44], NVIDIA NGC, Project DIGITS (Linux) [45], AI Blueprints [46], Cosmos [47]. Программная экосистема NVIDIA представляет собой комплексное решение, охватывающее весь цикл разработки AI-приложений: от базо- вых вычислительных платформ, таких как CUDA, до специализированных отраслевых решений, таких как DRIVE и Omniverse. Завершая обзор продукции NVIDIA, можно предположить, что, несмотря на ожесточённую конкурентную борь- бу, эта корпорация по совокупности позиций будет оставаться в лидерах, по крайней мере, ещё несколько бли- жайших лет. Ускоритель графического процессора AMD Instinct MI300X и технология упаковки 3.5D Компания Advanced Micro Devices (AMD) может претендовать на роль крупного игрока на рынке процессо- ров для ИИ. Это одна из старейших компаний в области микропроцессо- ров, основанная ещё в 1969 году Джер- ри Сандерсом. В последние годы AMD сделала радикальный поворот в сторо- ну искусственного интеллекта. Приоб- ретение компании Xilinx за $49 млрд в 2022 году стало крупнейшей сделкой в истории полупроводниковой инду- стрии, а покупка Pensando за $1,9 млрд укрепила позиции в области сетевых технологий центров обработки дан- ных. В 2024 году AMD запустила в про- изводство революционный для того времени высокопроизводительный ускорительный модуль MI300X, раз- работанный специально для решения задач, связанных со сверхбольшими вычислительными мощностями (High Performance Computing – HPC), в том числе для обучения и работы больших языковых моделей. По итогам года этот процессор стал одним из наиболее успешных проек- тов, который достиг отметки в $1 млрд продаж быстрее любого другого про- дукта в истории AMD. Последняя модель ускорительно- го модуля AMD Instinct™ MI300X GPU Accelerator представляет собой одну из наиболее совершенных на сегод- няшний день конструкций ГПУ- ускорителей, разработанных когда- либо компанией AMD [48]. Имеет смысл пояснить название это- го устройства, которое употребляет сам изготовитель. Термин GPU Accelerator обозначает устройство, которое позво- ляет увеличить производительность обработки данных, используя возмож- ности параллельной обработки GPU в дополнение к центральному процессо- ру CPU. В англоязычных статьях часто оставляют только слово Accelerator, которое лучше по смыслу переводить как «ускорительный модуль». Именно этот термин мы будем использовать в дальнейшем. Ускорительный модуль AMD Instinct MI300X – это не просто «большая видеокарта», а сложнейшая трёх- мерная структура взаимосвязанных микросхем, созданная по технологии 3D-стекинга (рис. 9). Эта схема полу- чила такое внутрифирменное назва- ние AMD, как «Технология упаковки 3.5D», фиксируя внимание на ком- бинации 3D-стекирования GPU и I/O- кристаллов с помощью гибридного бондинга в сочетании со стандарт- ной 2.5D-упаковкой (рис. 9). Конструкция Instinct MI300X включа- ет восемь графических вычислитель- ных чипов (Accelerator Complex Die – XCD), уложенных в трёхмерные стеки. В состав XCD входят ядра и компонен- ты для обработки данных. Каждый XCD, созданный по технологии 5 нм TMSC, содержит 38 вычислительных блоков (Compute Units – CU), разрабо- танных на основе архитектуры AMD CDNA 3. Всего в одном MI300X содер- жится 304 вычислительных блока (CU). При этом конкретный XCD имеет свой выделенный кэш L2 4 МБ, обе- спечивающий более быстрый доступ к часто используемым данным. Кроме того, MI300X может быть оснащён общим 256 МБ AMD Infinity Cache™ для всех восьми XCD, что обе- спечивает ещё один уровень кэширо- вания для сокращения доступа к памя- ти вне чипа. Четыре интегральные сборки на кристалле (IO Dies), выполняющие функции ввода/вывода, управляют памятью, взаимосвязью и маршрути- зацией данных. Кроме того, они коор- динируют работу всех XCD с использо- ванием специальной сети связи AMD Infinity Fabric. Эта сеть фактически выполняет функцию «нервной систе- мы» MI300X, которая позволяет всем частям ускорительного модуля мгно- венно обмениваться информацией. Технология AMD Infinity Fabric позволяет реализовать высокоско- ростные связи с малой задержкой между отдельными элементами и всей системой в целом со скоростью до 896 Гбайт/с. Взаимодействие XCD и IOD осущест- вляется с помощью усовершенство- ванной технологии 3D Stacking. По существу, AMD Instinct MI300X представляет собой сложную структуру взаимосвязанных чипсетов, оптимизи- рованных для высокой производитель- ности и эффективного доступа к памя- ти, объединяющую восемь 12-слойных стеков памяти HBM3 с восемью 3D-стековыми 5-нм чипсетами XCD на четырёх магистральных сборках на кристалле – 6-нм IOD-кристаллах. Процессорный модуль Instinct MI300X использует восемь стеков внешней памяти HBM3, по 24 Гбайт каждый, что обеспечивает суммарный объём 192 Гбайт. Скорость доступа к памяти составляет 5,3 Тбайт/с. Рис. 9. Трёхмерная архитектура AMD Instinct MI300X
RkJQdWJsaXNoZXIy MTQ4NjUy