Современная электроника №6/2025

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 43 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 ускорителей ИИ, который по прогно- зам достигнет $500 млрд к 2028 году, что подчёркивает важность данного продукта для бизнеса [58]. Если эти обещания оправдаются, AMD может существенно изменить расклад сил на рынке ИИ-ускорителей, предоставив заказчикам реальную альтернативу решениям NVIDIA и простимулировав инновации во всей отрасли. Cerebras WSE-3 – всё для ИИ на одном кристалле По всей видимости, одной из наибо- лее впечатляющих новинок в области АПИИ стал Cerebras WSE-3, представ- ленный в мае 2024 года. Этот процес- сор знаменует собой революцию в архитектуре процессоров для искус- ственного интеллекта. Несмотря на то что название Cerebras Systems знакомо далеко не всем специалистам, это достаточно крупная американская компания с «хорошей родословной». Она была основана в 2015 году пятью инже- нерами из фирмы SeaMicro, которая была продана AMD в 2012 году. На сегодняшний день Cerebras Systems имеет офисы в Саннивейле, Сан- Диего, Торонто и Бангалоре (Индия) и насчитывает около 525 сотрудников. В 2025 году планируется завершение оформления IPO под тикером CBRS с целевой оценкой до $8 млрд. Приме- чательно то, что эта компания сильно зависит от одного крупного клиента G42 из Объединённых Арабских Эми- ратов, который обеспечил 87% всей выручки за 2024 год. Компания G42 является ведущей технологической группой арабского мира, специализирующейся на искус- ственном интеллекте (ИИ), облачных вычислениях, хранении данных и гео- пространственном интеллекте. Штаб- квартира находится в Абу-Даби [59]. Компания Cerebras Systems разрабо- тала Wafer-Scale Engine 3 WSE 3 – про- цессор, который кардинально пере- осмысливает подходы к созданию вычислительных систем для искус- ственного интеллекта. Этот чип пред- ставляет собой не просто очередное улучшение существующих техноло- гий, а принципиально новую архи- тектурную концепцию. Главная особенность WSE-3 заключа- ется в его монолитной конструкции: весь процессор изготавливается из единой кремниевой пластины (Wafer) площадью 462 см², что в 57 раз боль- ше флагманского GPU NVIDIA H100 [59]. Эта инновационная конструкция позволила создать чип рекордных раз- меров с беспрецедентными характе- ристиками. В табл. 6 приведены сравнительные характеристики Wafer Scale Engine-3 и H100 [60]. Данные, приведённые в табл. 6, демонстрируют преимущества про- цессора Cerebras Wafer Scale Engine 3 по сравнению с ускорителем графиче- ского процессора Nvidia H100. Процессор WSE-3, созданный с использованием новейшего 5-нм тех- процесса, является основой суперком- пьютера Cerebras CS-3 AI (рис. 11) [61]. Нужно отметить, что особое внима- ние в процессоре Cerebras WSE-3 уде- лено системе памяти, которая принци- пиально отличается от конкурентов. В процессоре используется 44 ГБ встро- енной SRAM-памяти, распределённой непосредственно на кристалле рядом с вычислительными ядрами. Это в 880 раз больше, чем у NVIDIA H100. В этом заключается коренное отли- чие системы памяти Cerebras от NVIDIA, использующей внешнюю HBM3E-память [64]. Дополнительно системы суперком- пьютерных блоков CS-3 на основе WSE- 3 могут быть оснащены внешней памятью объёмом 1,5 Тбайт, 12 Тбайт или даже 1,2 Пбайт. Монолитная конструкция на одной кремниевой пластине обеспечивает ключевое преимущество WSE-3, кото- рое заключается в исключительной пропускной способности, составляю- щей 21 Пбайт в секунду для памяти (это в 7000 раз выше H100) и 214 Пбит в секунду для внутренних соединений (это в 3715 раз быстрее H100). В тра- диционных системах ИИ множество отдельных процессоров должны посто- янно обмениваться данными через относительно медленные межсоеди- нения. В WSE-3 все ядра находятся на одном кристалле и связаны высоко- скоростными внутренними шинами, Рис. 11. Схема суперкомпьютера Cerebras CS-3 AI Таблица 6. Сравнительные характеристики Cerebras Wafer Scale Engine-3 и NVIDIA H100 Характери- стика Cerebras WSE-3 NVIDIA H100 Преиму- щество Cerebras Размер чипа 46 225 мм² 814 мм² 57x Ядра 900 000 16 896 FP32 + 528 Tensor 52x Память на чипе 44 Гбайт 0,05 Гбайт 880x Пропускная способность памяти 21 Пбайт/с 0,003 Пбайт/с 7000x Пропускная способность шины 214 Пбит/с 0,0576 Пбит/с 3715x

RkJQdWJsaXNoZXIy MTQ4NjUy