Современная электроника №4/2025

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ 32 WWW.CTA.RU СОВРЕМЕННАЯ ЭЛЕКТРОНИКА • № 4 / 2025 онно популярный в научных класте- рах; Ray, предназначенный в качестве универсального фреймворка для рас- пределённых приложений. Верхний уровень обеспечивает доступ к возможностям ИИ для конеч- ных пользователей и внешних систем. Серверные API верхнего уровня представляют собой интерфейсы, через которые пользователи и при- ложения взаимодействуют с моде- лями ИИ. Из наиболее популярных можно выделить FastAPI и Flask. Это лёгкие и быстрые решения для созда- ния API. Утилита gRPC обеспечивает более эффективную передачу данных при высоких нагрузках. Верхний уровень также содержит программы для поддержки инферен- са, такие как Triton Inference Server и TorchServe. Системы кэширования и баланси- ровки нагрузки Redis, Memcached и NGINX обеспечивают быстрый доступ при больших загрузках к часто исполь- зуемым серверам. Кроме того, верхнему уровню при- надлежат также утилиты мони- торинга и логирования, которые отслеживают работу системы и помо- гают выявлять проблемы, например, Prometheus, Grafana, Elasticsearch, Logstash, Kibana и другие. Перечисленные программные про- дукты были приведены здесь только в качестве известных примеров и дале- ко не полностью представляют всю линейку программных продуктов, задействованных в современных ИИ. Более подробное описание принципов работы современных мощных моде- лей ИИ можно посмотреть в деталь- ном обзоре [15]. Цель этого раздела заключалась в том, чтобы показать, что такая мно- гоуровневая архитектура позволя- ет эффективно управлять всем жиз- ненным циклом больших языковых моделей, обеспечивая оптимальное использование вычислительных ресурсов и высокое качество обслу- живания конечных пользователей. При этом каждый уровень развива- ется в значительной степени незави- симо, что позволяет внедрять инно- вации без перестройки всей системы. Ведущие компании – разработчики искусственного интеллекта Из огромного количества появив- шихся в настоящее время компаний, занимающихся разработками ИИ, трудно выделить те, которые занима- ют первые места в этом направлении. Тем не менее, основываясь на мнении наиболее авторитетных экспертов в области искусственного интеллекта, можно говорить о тех компаниях, чья продукция представляется наиболее перспективной. На основе прогнозов развития ИИ, сде- ланных такими гигантами, как Google [16]; IBM IBV [17, 18]; Gartner [19]; Statista [20]; AlphaSens [21]; CB Insights [22], мы постарались выделить те компании, которые действительно занимают лиди- рующие направления в разработках наи- более важных приложений ИИ. В этой статье не рассматривают- ся российские большие модели ИИ, которым посвящено достаточно боль- шое количество статей в Интернете. Подробный обзор российских компа- ний, которые занимаются созданием решений на основе генеративного ИИ, а также сопутствующих инструмен- тов, доступен на сайте [23]. Поскольку в этой статье цитируют- ся в основном источники ведущих мировых компаний, ниже использо- вана общепринятая в англоязычной литературе аббревиатура, расшифров- ка которой приведена в табл. 1. Ниже коротко рассмотрены только несколько наиболее крупных и вли- Таблица 1. Общепринятая в англоязычной литературе аббревиатура базовых направлений искусственного интеллекта ABI Agent-Based AI Агентные системы ИИ AGM Audio Generative Model Генерация аудио AGI Artificial General Intelligence Сильный искусственный интеллект AIS AI Supercomputer ИИ на базе суперкомпьютера ATS Autonomous Transport Systems Автономные транспортные системы AR Accuracy Rewards Награды за точность решения BCI Brain-Computer Interfaces Интерфейсы мозг–компьютер BDS AI Bias Detection Systems Системы обнаружения предвзятости ИИ CSD Сold-Start Data Начальный анализ на основе ранее накопленного опыта CV Computer Vision Компьютерное зрение CV&IG Computer Vision & Image Generation Компьютерное зрение и генерация изображений DGX Data Center GPU eXtreme Дата-центр Nvidia GAN Generative Adversarial Networks Генеративные состязательные сети GPU Graphics Processor Unit Графические процессоры GPU GRPO Group Relative Policy Optimization Оптимизация групповой относительной политики IGM Image Generation Models Модели генерации изображений IFT AI Fairness Tools Инструменты обеспечения справедливости ИИ FR Format Rewards Награды за чётко структурированный вывод LLM Large Language Models Большие языковые модели MFR Multifunctional Robots Многофункциональные роботы NGA New Generation AI Новое поколение ИИ POD Performance Optimized Datacenter Модульные кластеры Nvidia PPO Proximal Policy Optimization Оптимизация ближайшей политики PRL Pure Reinforcement Learning Чистое обучение с подкреплением RIP Responsible AI Practices Ответственные практики ИИ RLHF Reinforcement Learning from Human Feedback Обучение с обратной связью от человека RBR Rule-Based Rewards Награды на основе правил RBR S2T Speech-to-Text Модели преобразования голоса в текст SAI Specialized AI systems Специальные системы ИИ SLM Small Language Models Малые языковые модели SFT Supervised Fine-Tuning Тонкая настройка с помощью человека-супервизора T2I Text-to-Image Модели преобразования текста в изображение T2S Text-to-Speech Модели преобразования текста в голос TPU Tensor Processing Units Тензорный процессор VGM Video Generative Model Генерация видео

RkJQdWJsaXNoZXIy MTQ4NjUy