Современная электроника №6/2025
СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 44 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 6 / 2025 что устраняет эти узкие места [65]. Такая архитектура особенно эффек- тивна для обучения больших языко- вых моделей, где требуется обработка огромных объёмов данных со множе- ственными взаимосвязями между раз- личными частями нейросети [66]. Для создания ещё более мощных систем Cerebras разработала техноло- гию масштабирования, позволяющую объединять до 2048 суперкомпьюте- ров CS-3 в единые кластеры. Это обе- спечивает линейное масштабирова- ние производительности без потери эффективности. Впечатляющим примером тако- го масштабирования является про- ект Cerebras Condor Galaxy, который представляет собой сеть взаимосвя- занных суперкомпьютеров CS-3, раз- рабатываемых совместно с компани- ей из ОАЭ G42. Целью проекта является создание крупнейшей и самой быстрой в мире инфраструктуры суперкомпьютеров, предназначенной для генеративного искусственного интеллекта. Уже построены Condor Galaxy 1 и 2 с производительностью в четыре экзафлопс. Продолжается строитель- ство Condor Galaxy 3, планируемая мощность которого восемь экзафлопс. Система Condor Galaxy 1–2 спроекти- рована как облачный распределённый суперкомпьютер ИИ, позволяющий учёным в разных городах и странах использовать её ресурсы для круп- номасштабных задач ИИ и научных задач. В настоящее время вычисли- тельными мощностями Condor Galaxy 1–2 могут пользоваться учёные во мно- гих городах США и в некоторых дру- гих зарубежных странах, в том числе и в режиме онлайн. Condor Galaxy 3 (CG-3) будет состо- ять из 64 системных блоков CS-3, что позволит обучать модели с параметра- ми до 24 триллионов. Это в 10 раз боль- ше, чем GPT-4 или Gemini [67]. В рамках создания третьей ста- дии проекта CG-3 компания Cerebras Systems добавляет шесть новых цен- тров обработки данных ИИ в Северной Америке и Европе. Это увеличит про- пускную способность вывода до более чем 40 миллионов токенов в секунду. Новые объекты будут созданы в Дал- ласе, Миннеаполисе, Оклахома-Сити, Монреале, Нью-Йорке и городах Фран- ции, при этом 85% от общей мощно- сти будет находиться в Соединённых Штатах [68]. Следует обратить внимание на то, что суперкомпьютеры CS-3 на базе WSE-3 физически расположены в США (Санта-Клара, Даллас), но управляются совместно с G42 из ОАЭ. Это позволяет Cerebras и G42 контролировать доступ в соответствии с американским зако- нодательством, при этом предостав- ляя ресурсы международным исследо- вателям из дружественных стран [69]. Опыт использования системы Condor Galaxy уже показал её огром- ную значимость для развития ИИ, а также многих направлений мировой науки и техники, требующих больших вычислительных мощностей. Системы CS-3 на базе WSE-3 от Cerebras представляют собой значи- тельный скачок в скорости и эффек- тивности обучения ИИ, особенно для больших языковых моделей, таких как Llama 2 (70 млрд параметров). Например, традиционное обучение Llama 2 требовало около 1,7 миллио- на часов работы GPU, распределённых по тысячам высокопроизводитель- ных GPU. На это уходило несколько недель рабочего времени в зависи- мости от размера кластера и эффек- тивности [70]. Сегодня компактная конфигурация всего из четырёх систем CS-3 может точно обучить модель Llama 2 с семью- десятью миллиардами параметров менее чем за день [71]. Впечатляющие результаты были получены в фундаментальных науч- ных исследованиях. Например, иссле- дователи Аргоннской национальной лаборатории получили премию Гор- дона Белла за исследования вариан- тов COVID-19, выполненные на кла- стере CS-2. В мае 2024 года команда из Сандий- ской национальной лаборатории смо- делировала взаимодействие 800 000 атомов, сократив год вычислений до двух дней [72]. По достоинству оценили возможно- сти процессоров Cerebras некоторые ведущие производители электрон- ных компонентов. Например, концерн Qualcomm заключил с Cerebras согла- шение об обучении с помощьюWSE-3 моделей ИИ, которые будут работать на процессорах Qualcomm AI 100 Ultra [73]. Также объявлено о сотрудничестве с Dell Technologies в области разработ- ки новой прикладной инфраструкту- ры генеративного искусственного интеллекта [74]. Нужно также сказать несколько слов о стоимости этого оборудова- ния. Согласно данным отраслевого издания Data Center Dynamics, компа- ния Cerebras не раскрывает официаль- ную стоимость своих чипов, однако, по оценкам экспертов, они стоят око- ло $2–3 млн за единицу [75]. По информации Reuters, первый суперкомпьютер Condor Galaxy 1 с 32 узлами обошёлся партнёру G42 в $100 млн, что составляет $3,13 млн за узел, включая обслуживание. Полная программа развёртывания 9 кластеров может превысить $900 млн [76]. Аналитики The Next Platform оце- нивают стоимость полномасштабно- го кластера из 2048 систем CS-3 в рай- оне $5–6 млрд [77]. Завершая этот короткий обзор новой продукции Cerebras, можно с уверен- ностью говорить о том, что WSE-3 представляет собой радикальный отход от традиционных подходов в проектировании процессоров. Успех WSE-3 может стать началом нового этапа в развитии специализирован- ных процессоров для искусственного интеллекта. Заключение Анализ современного рынка аппа- ратного обеспечения для искусствен- ного интеллекта показывает, что эта отрасль переживает период актив- ных изменений. Рассмотренные в дан- ной статье решения от NVIDIA, AMD и Cerebras представляют лишь наиболее яркие примеры инновационных под- ходов к созданию ИИ – ускорителей процессоров. Благодаря экосистеме CUDA и уни- версальности решений сегодня на рынке ускорителей графических про- цессоров продолжает доминировать NVIDIA. Архитектура Blackwell (B200/ B300) с поддержкой FP4 и революци- онной двухкристальной конструкци- ей устанавливает новые стандарты производительности для обучения и инференса больших языковых моде- лей. Технология упаковки 3.5D, исполь- зованная AMD в своих ускорителях MI300X/MI325X, предлагает конкурен- тоспособную альтернативу с большим объёмом памяти (192 Гбайт) и откры- той программной платформой ROCm, что особенно привлекательно для кор- поративных заказчиков, стремящих- ся к независимости от монополии NVIDIA.
RkJQdWJsaXNoZXIy MTQ4NjUy