В отчёте «Стабилизация энергоснабжения для обучающих ИИ ЦОД» (Power Stabilization for AI Training Datacenters) выявлена тревожная тенденция, связанная с масштабным внедрением ИИ. Работа ускорителей включает две основные фазы: вычислительную, когда оборудование активно потребляет энергию для сложных расчётов, и коммуникационную, когда идёт обмен данными. Переход между этими фазами сопровождается резкими скачками энергопотребления — спадом при завершении вычислений и стремительным ростом при их возобновлении.
В случае крупных дата-центров такие скачки могут достигать десятков или даже сотен мегаватт, создавая серьёзную нагрузку на энергосистемы. Проблема не только в неэффективном использовании ресурсов — колебания потребления могут совпасть с резонансными частотами ключевых компонентов энергосети, включая генераторы и оборудование ЛЭП. Это потенциально приводит к дестабилизации сети, повреждению оборудования и масштабным авариям. Таким образом, активность ИИ представляет прямую физическую угрозу для энергетической инфраструктуры.
Для решения проблемы предлагаются три подхода. Первый — поддержание ускорителей в режиме «холостого хода» за счёт выполнения второстепенных задач during простоя. Этот метод прост, но не повышает энергоэффективность и может снижать производительность. Второй подход — установка минимального порога энергопотребления на уровне ИИ-ускорителей, что также не решает проблему оптимизации.
Третий и наиболее перспективный вариант — использование систем аккумулирования энергии. Они заряжаются в периоды низкого потребления и отдают накопленную энергию during пиковых нагрузок, сглаживая колебания. Например, Google уже размещает литий-ионные ячейки непосредственно в серверных стойках, а NVIDIA оснастила блоки питания для стоек GB300 NVL72 буфером, снижающим пиковую нагрузку на сеть до 30%.
Энергосети давно являются критической инфраструктурой, но новые угрозы возникают на стыке цифрового и физического мира. Злоумышленники, получив доступ к крупному ИИ-кластеру, могут намеренно изменить паттерн энергопотребления, чтобы нанести ущерб материальной инфраструктуре — даже без физического приближения к объектам.
В докладе подчёркивается, что масштабы использования ИИ достигли уровня, когда цифровая активность имеет серьёзные физические последствия. Специалистам по кибербезопасности теперь необходимо учитывать не только цифровые угрозы, но и защиту критической инфраструктуры от воздействия алгоритмов. Ярким примером стал инцидент летом 2024 года в Вирджинии, когда миллисекундный сбой привёл к отключению 60 дата-центров общей мощностью 1,5 ГВт на несколько часов.
Источник: https://servernews.ru/1128423Если вам понравился материал, кликните значок - вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал - не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!