Встраиваемые системы для ресурсоёмких вычислений

В связи с развитием технологий IoT/AIoT высокопроизводительные вычислительные системы становятся всё более востребованными на рынке. Дополнительные преимущества при решении ресурсоёмких задач интеллектуальной обработки изображений, нейронных вычислений, управления устройствами в реальном времени встраиваемому компьютеру обеспечивает мощная графическая подсистема. Компания ADLINK предлагает оригинальную концепцию встраиваемых безвентиляторных платформ с графическими подсистемами NVIDIA.

Широков Юрий

322
В ЗАКЛАДКИ

Экономические перспективы внедрения ИИ

Международная консалтинговая компания McKinsey считает, что применение искусственного интеллекта (ИИ) в сфере маркетинга, продаж и логистики поставок в промышленном производстве может создать компаниям дополнительную прибыль порядка $2,7 млрд в течение последующих 20 лет. В исследовании были рассмотрены пять категорий искусственного интеллекта: компьютерное зрение, обработка естественного языка, виртуальные помощники, интеллектуальные процессы автоматизации и углублённое машинное обучение. Различные компании, разумеется, будут использовать эти инструменты в разной степени. Некоторые станут придерживаться осторожного подхода, тестируя только одну технологию и применяя её в определённой сфере. Другие проявят бо́льшую смелость, освоив все пять областей, а затем интегрировав их в свой бизнес. Между этими двумя полюсами будет много компаний на разных этапах вовлечённости в процессы внедрения ИИ в производство. Как бы то ни было, прогноз показывает, что к 2030 году в среднем около 70% компаний примут и будут использовать в бизнесе хотя бы один тип технологии ИИ, но полностью освоят пять категорий менее половины.
Весьма вероятно, что технологии искусственного интеллекта приведут к разрыву в производительности между лидерами (компаниями, которые полностью внедрят инструменты искусственного интеллекта на своих предприятиях в течение следующих пяти–семи лет) и компаниями, которые вообще не будут применять технологии искусственного интеллекта к 2030 году. При этом лидеры, скорее всего, экономически и технологически выиграют непропорционально. К 2030 году они потенциально смогут удвоить свою прибыль. Технологические лидеры, как правило, имеют сильную стартовую базу ИТ, более высокую склонность инвестировать в ИИ и позитивные взгляды на экономические перспективы его внедрения. Находящиеся на другом конце спектра предприятия могут столкнуться с примерно 20-процентным снижением своего нынешнего денежного потока. Одним из важных факторов здесь является наличие сильной конкурентной динамики среди компаний, которая может «украсть» долю рынка у отстающих в пользу лидеров (рис. 1).

Источник: McKinsey Global Institute analysis

Итак, будущее за бизнесом, делающим ставку на сверхпроизводительные встраиваемые вычислители и искусственный интеллект, функционирующий на их базе. А повышение производительности вычислений в задачах ИИ многие напрямую связывают с внедрением технологий гетерогенных вычислительных платформ, в которых графическим подсистемам отводится далеко не последняя роль.

GPU во встраиваемых приложениях

Графические функции широко используются во многих вертикальных приложениях, поэтому добавление графического процессора во встраиваемую систему может существенно упростить процесс проектирования для широкого круга разработчиков систем, OEM-производителей и системных интеграторов. Встроенные графические решения позволяют разработчикам систем, OEM-производителям и системным интеграторам значительно улучшить производительность обработки изображений в аэрокосмической, морской, медицинской отраслях и промышленной автоматизации, в управлении дорожным трафиком, ускорении вычислений. Во встраиваемых приложениях графические процессоры могут управлять мультидисплейными системами с высоким разрешением и ускорять построение изображений. Всё чаще применяются графические процессоры (GPU, ГПУ) для сложных вычислений в нейронных сетях и в приложениях искусственного интеллекта.
В целом использование графических процессоров позволяет увеличить скорость и точность работы приложения, а также снизить время отклика системы (рис. 2).

Однако самостоятельное добавление графического процессора во встраиваемую систему может оказаться сложной задачей.
Одним из простейших подходов здесь является использование видеокарт, разработанных для сегмента игровых приложений, на который приходится около трети всех производимых графических процессоров. Но проблема в том, что эти карты часто не удовлетворяют ключевым требованиям, предъявляемым к встраиваемой промышленной системе: немедленная и долговременная доступность продукта, а также компактность и высокая энергоэффективность. Вследствие стремления производителей быстрее переходить на новейшие технологии обработки графики многие коммерческие графические решения, разработанные для игровых приложений, имеют относительно короткий жизненный цикл. Когда поставщики встраиваемых решений реализуют свои продукты на основе этих коммерческих графических карт, они бывают вынуждены проводить частые сертификации продукции, которые могут отнимать много времени и являются далеко не дешёвым удовольствием. Это лишь один из факторов, побуждающих разработчиков систем, OEM-производителей и системных интеграторов рассматривать интеграцию встраиваемых продуктов на базе графических процессоров от зарекомендовавшего себя производителя, каковым является компания ADLINK.
В работе над обеспечением приложений, использующих GPU, компания ADLINK объединила усилия с компанией NVIDIA, став партнёром NVIDIA® Quadro® Embedded. Это позволило ADLINK предложить всеобъемлющую линейку решений для встраиваемой графики на основе графических процессоров NVIDIA Quadro, полностью раскрывая потенциал их применения на рынках встраиваемых систем. Встраиваемая графика ADLINK доступна в формате модулей Mobile Express (MXM) и карт PCI Express Graphics (PEG). Она обеспечивает высокую производительность, значительную пропускную способность, энергоэффективность, а также долговременную доступность и надёжность решений. Вот типичные сферы применения графических платформ ADLINK:
  • поддержка нескольких дисплеев с высоким разрешением: приложения включают в себя управление полётами в авиации, электронные табло и информационные системы (ECDIS), видеостены, цифровые вывески, медицинскую диагностическую технику, видеоигры;
  • параллельные вычисления: высокопроизводительная обработка приложений, включая радиолокационные/сонарные системы в аэрокосмической и оборонной промышленности, ультразвуковая визуализация в здравоохранении и ускоренные облачные периферийные вычисления с мультидоступом (AMEC – Accelerated Multi-Access Edge Computing) в телекоммуникациях;
  • основа для ИИ: система обучения в смарт-производстве, умный город, телекоммуникации, аэрокосмическая и оборонная промышленность, транспорт.
Само же использование промышленных безвентиляторных платформ вместо традиционных стоечных решений не только обеспечивает повышенную надёжность с более высоким значением MTBF (среднее время между отказами), такие решения также нуждаются в меньшей площади для развёртывания на предприятии. Благодаря оптимальному дизайну с минимальной избыточной функциональностью (например, серии MVP 6010/6020) системные интеграторы могут предлагать клиентам более выгодные комплексные решения с функциональностью графических процессоров на их основе.
В этой статье мы покажем, как внедряются графические решения, используемые во встраиваемых приложениях, а также рассмотрим их преимущества и приведём несколько примеров применения встраиваемых систем ADLINK.

Контроль качества на производстве

Системы автоматизированного оптического контроля (AOI – Automated Optical Inspection) сегодня широко используются для проверки различных компонентов: дисплейных панелей, мобильных телефонов, печатных плат и многого другого. С помощью встроенной графической платформы алгоритмы AOI сравнивают образ произведённого компонента с эталонным образцом для выявления и классификации дефектов. Такие установки могут, например, обнаружить отсутствующие компоненты или некачественную пайку на печатной плате.
В качестве альтернативы человеческому контролю AOI может обеспечить значительно более высокую пропускную способность и лучшее качество проверки.

Морская навигация

Штурманы современных морских судов прокладывают курс, используя электронные аналоги карт и информационные системы ECDIS (или ЭКНИС – электронно-картографическая навигационно-информационная система), помогающие им избежать известных препятствий на пути судна. Не отмеченные на картах препятствия можно обнаружить при помощи анализа изображений, созданных посредством радаров, эхолотов и других датчиков.
Встраиваемая графика может применяться для «сшивания» картографических данных ECDIS и построенных при помощи сенсоров изображений в единую картину, обеспечивающую всеобъемлющий панорамный вид навигационной информации и максимально доступно отображающую окружающую обстановку.

Безопасность авиаперелётов

Для обеспечения безопасности полётов аэропортам приходится часто инспектировать взлётно-посадочные полосы на предмет наличия даже мелкого мусора и других посторонних предметов размером всего в два сантиметра. При «ручном» выполнении этой работы она может занять несколько часов. AOI может стать хорошей альтернативой, значительно сокращающей время проверки, повышающей точность обнаружения препятствий и, как следствие, уменьшающей вероятность задержек полетов. Алгоритмы на основе искусственного интеллекта могут также идентифицировать птиц в небе над аэропортом, потенциально способных стать причиной авиакатастрофы.

Медицинская техника

Портативное ультразвуковое устройство является незаменимым медицинским диагностическим инструментом, позволяющим быстро оценить состояние пациента при оказании медицинской помощи. Быстрая диагностика чрезвычайно важна, а встраиваемая графика помогает повысить скорость и точность обработки изображений. Встраиваемые графические решения могут применяться и в мобильных приложениях, требующих низкого энергопотребления и компактности.
Общей для всех приведённых примеров задачей встраиваемых приложений является необходимость быстрой передачи данных, получаемых от датчиков и из других источников для обработки в GPU. ADLINK добивается этого путём реализации механизма удалённого прямого доступа к памяти (RDMA – Remote Direct Memory Access) – функция технологии NVIDIA GPUDirect™, реализованная в графических процессорах NVIDIA® Quadro® и увеличивающая скорость обмена данными со сторонними устройствами при использовании стандартных функций PCI Express примерно на 80% (от 3,6 до 6,5 Гбит/с). RDMA предоставляет внешним источникам данных прямой доступ к внешней памяти графического процессора, как показано на рис. 3.

При передаче данных в графический процессор без использования этой функции они должны быть вначале скопированы в память ЦПУ (красные стрелки на правой стороне рис. 3), что неоправданно увеличивает задержку передачи.
Таким образом, как партнёр NVIDIA Quadro Embedded с большим опытом работы со встраиваемыми приложениями ADLINK является хорошим поставщиком решений на основе GPUDirect, позволяющих использовать возможности встроенной графики в полную силу.

Решения ADLINK на базе GPU

ADLINK предлагает два семейства встраиваемых графических продуктов, оптимально подходящих для мультидисплейных установок высокого разрешения, используемых в централизованном управлении, мониторинге и высокопроизводительных вычислениях. Мобильные модули PCI Express (MXM) хорошо подходят для приложений, требующих компактности, малого веса и низкого энергопотребления (формат SWaP – Small Weight and Power), таких как портативные ультразвуковые установки, бортовые радары и аэрофотоаппаратура. Графические карты PCI Express (PEG) подключаются через стандартный интерфейс, и их легко интегрировать и использовать в здравоохранении (магнитно-резонансная – МРТ и компьютерная – КТ томография), промышленной автоматизации (AOI) и телекоммуникациях (периферийные вычисления с множественным доступом).

Компьютерные платформы

Компактные безвентиляторные встраи­ваемые компьютеры ADLINK Matrix обеспечивают оптимизированную высокодоступную вычислительную платформу с возможностями расширения, в том числе с помощью описанных ранее карт формата MXM. Безвентиляторные платформы отличаются компактными размерами и работают в широком диапазоне температур, выдерживают вибрацию с ускорением 5gRMS (Root-Mean-Square Acceleration – среднеквадратичное ускорение) и имеют прочную беспроводную конструкцию, предназначенную для использования в суровых условиях. Для менее требовательных приложений платформы DLAP с активным охлаждением поддерживают ресурсоёмкие рабочие нагрузки в задачах, требующих очень высокой вычислительной плотности в ограниченном пространстве (например, глубокое обучение, рис. 4).

Для разработчиков решений, которым необходимы расширяемые строительные блоки (рис. 5), конфигурируемые встроенные компьютеры ADLINK с помощью дополнительных карт могут предложить объединение высокопараллельных графических вычислений, управления движением и сбора данных.

Для приложений, требующих ещё большей масштабируемости, ADLINK предлагает легко конфигурируемые материнские платы и монтируемые в стойку промышленные шасси, обеспечивающие работу целого семейства промышленных материнских плат ATX ADLINK. Платы оснащены несколькими шинами PCIe/PCI, портами LAN/USB 3.0, обеспечивают немедленное многозадачное развёртывание, а также гарантируют баланс производительности и расширяемости.

Встраиваемая графика

Модули встраиваемых графических карт обеспечиваются 5-летней поддержкой производителя, реализуют технологии NVIDIA GPUDirect™, RDMA, NVEncode и NVDecode. Приведём для примера характеристики двух карт разных форм-факторов.
Карта EGX-MXM-P5000 основана на архитектуре Quadro Pascal, что обеспечивает превосходную графику и вычислительную производительность. EGXMXM-P5000 специально предназначена для форм-факторов, несовместимых с обычными картами PCI Express, и создана для работы в широком диапазоне температур. Это отличный выбор для блейд-серверных систем, где высокая плотность размещения графических процессоров имеет решающее значение (рис. 6).

Основные технические характеристики платы EGX-MXM-P5000 приведены в табл. 1.

Карта Quadro-E PEG P4000 (рис. 7) оптимально сочетает в себе производительность, функциональность и компактный форм-фактор.

Она хорошо показывает себя в различных 3D-приложениях. На карте установлен Pascal GPU с 1792 ядрами CUDA, 8 ГБ встроенной памяти GDDR5. Карта поддерживает до четырёх дисплеев с разрешением 8K (7680 × 4320 при 60 Гц). Технические характеристики Quadro-E PEG P4000 приведены в табл. 2.

Практическая реализация

Перед одним из клиентов ADLINK стояла задача контроля качества производимой им видеоаппаратуры. Контроль видеокадров было решено выполнять путём сравнения предварительно сохранённых в памяти эталонных изображений с изображениями, снятыми фрейм-граббером. При выборе компьютера для тестирования мультимедийных устройств было важно убедиться, что он соответствует всем необходимым для быстрого и эффективного выполнения работы требованиям. В частности, чтобы система работала бесперебойно, требуется быстрый канал связи между фрейм-граббером и SSD-диском. Общие требования, сформулированные для системы контроля, таковы:
  • один слот PCI x4 Gen 3 для обеспечения высокой пропускной способности соединений PCIe между захватом кадров и встраиваемой системой, чтобы гарантировать, что ни один кадр не будет отброшен;
  • двухканальная память DDR4 объёмом 32 ГБ, чтобы гарантировать, что кадры в реальном времени не будут пропущены при передаче проверенных кадров в память компьютера с использованием DMA в DRAM;
  • SSD со скоростью чтения 300 МБ/с, чтобы гарантировать, что эталонные кадры, хранящиеся на SSD, будут перенесены в память компьютера синхронно с тестируемыми. Низкая скорость чтения может привести к сбою сравнения;
  • высокопроизводительный процессор, например Intel® Core™ i7, ускоряющий тестирование и измерения.
Важным требованием было обеспечение компактности системы, что позволит добавлять больше контрольного оборудования, но не занимать при этом чрезмерную производственную площадь. Поскольку инспекционное оборудование является крупной инвестицией, важно, чтобы в процессе принятия решений учитывался CPR (коэффициент экономической эффективности).

Решение ADLINK

В качестве хорошей альтернативы прочим рассмотренным вариантам был предложен новейший продукт ADLINK из семейства встраиваемых вычислительных платформ MVP – серия MVP-6010/6020 (рис. 8), оптимизированная для удовлетворения совокупных требований к характеристикам оборудования, габаритам и цене.

Это одно из основных преимуществ ADLINK MVP 6010/6020, благодаря которому показатель CPR решения на его основе становится весьма привлекательным. Основанный на процессоре Intel® Core™ i7 6-го поколения MVP-6010/6020 с 4 слотами расширения – один PCIe x16 и три PCI или два PCIe x16 и два PCI – обеспечивает оптимальный баланс между функциональностью и производительностью при компактных размерах. Процессоры Intel Core i7 6-го поколения имеют на 30% бо́льшую производительность по сравнению с Intel Core предыдущего поколения, что ускоряет обработку кадров 4K/2K. Благодаря проверенной безвентиляторной конструкции серия MVP-6010/6020 рассчитана на работу при TDP (Thermal Design Power – мощность теплоотвода системы охлаждения) 65 Вт, что положительно сказывается на вычислительной мощности. Пропускные способности слота PCIe x16 и DDR4 DRAM MVP-6010/6020 являются оптимальными для мультимедийных инспекционных приложений высокой чёткости, поэтому устройства захвата кадров могут работать с видеоизображениями 4K/2K (до 4096×2160 точек) при 60 кадр/с, а 18 ГБ буфер данных обеспечивает работу без пропуска кадров. MVP-6010/6020 оснащён интерфейсом SATA III (до 6,0 Гбит/с), который позволяет твердотельным накопителям работать с максимальной пропускной способностью, что обеспечивает непрерывность процесса сопоставления кадров с эталоном. Кроме того, интеграция предварительно проверенных плат захвата фреймов ADLINK гарантирует максимальную совместимость. Такой выбор позволил компании-инвестору потратить своё драгоценное время на разработку программного обеспечения и общей концепции, а не на оптимизацию производительности оборудования.
После запуска системы преимущества эффективности автоматизированного тестирования по сравнению с «человеческим» подходом стали совершенно очевидны: раньше оно занимало 600 с (10 минут) на один продукт, а теперь благодаря компьютеру занимает всего 15 с на продукт (рис. 9).

Заключение

Объединяя свой богатый опыт взаимодействия с разработчиками встраиваемых систем и поддерживая тесные партнёрские отношения с NVIDIA, компания ADLINK предлагает высокопроизводительные встраиваемые графические решения с долгим жизненным циклом для многих сегментов рынка. ADLINK, будучи одним из всего четырёх в мире партнёров NVIDIA по программе Quadro Embedded Partners, может предоставить техническую поддержку для настройки прошивки графического процессора, что служит важным фактором для заказчиков встраиваемых систем. Клиенты получат снижение затрат на разработку, которые в критически важных для безопасности приложениях могут достигать шестизначных сумм, поскольку такие изделия подвергаются длительным и дорогостоящим процессам тестирования и сертификации. Нельзя не отметить и ещё один момент – долгую жизнь продуктов на базе встраиваемой платформы: на протяжении её жизненного цикла графические продукты сектора потребительской электроники могут смениться трижды. Таким образом, становится очевидным, что разработка со встраиваемой графикой обеспечит превосходную окупаемость инвестиций. ●

E-mail: textoed@gmail.com


ПОДПИСАТЬСЯ НА НОВОСТИ

Будьте всегда в курсе самых свежих новостей
и узнавайте первыми о содержании нового номера

Подписка на новости

РЕКОМЕНДУЕМ