Nvidia представила Cosmos Reason — ИИ, который учит роботов «думать, как люди»

Новая модель искусственного интеллекта от Nvidia, Cosmos Reason, позволяет роботам анализировать визуальный мир, рассуждать на основе здравого смысла и принимать решения — как человек. Это прорыв в создании интеллектуальных машин, способных понимать не только «что», но и «почему».

13.08.2025 523 0 0

печатать

Nvidia представила Cosmos Reason — ИИ, который учит роботов «думать, как люди»

Роботы уже умеют перемещаться, поднимать предметы и выполнять команды. Но настоящий интеллект — это не просто действие по инструкции. Это понимание контекста, причинно-следственных связей и скрытых мотивов. Именно это и стремится дать новая модель от Nvidia — Cosmos Reason.

Анонсированная на конференции по технологиям моделирования, эта система представляет собой революцию в области визуального ИИ, предназначенную не просто «видеть», а рассуждать о мире, как это делает человек.

«Здравый смысл» для машин: как роботы учатся думать

Cosmos Reason — это модель языка машинного зрения (VLM), но с мощной способностью к логическому мышлению. В отличие от традиционных моделей, которые генерируют текст или изображения по запросу, Cosmos Reason анализирует видео и графику, чтобы понять, что происходит, почему это происходит и что может произойти дальше.

«Мы хотим, чтобы роботы думали, как люди — руководствуясь здравым смыслом», — сказал Рев Ле-Баредиан, вице-президент по Omniverse и технологиям моделирования в Nvidia. — «Cosmos Reason помогает им принимать решения, основанные не на жестких правилах, а на понимании мира».

Например:

Робот видит, что человек берёт хлеб, включает тостер, достаёт масло. Он не просто фиксирует действия — он делает вывод: "Человек готовит тосты". И может предугадать следующее: понадобится тарелка, возможно, чашка чая".

Такой уровень рассуждений — редкость в робототехнике. Cosmos Reason способен:

Понимать физические взаимодействия (что толкает, что падает, что может сломаться);
Делать выводы о намерениях людей и объектов;
Обрабатывать новые, ранее неизвестные сценарии — так называемый «длинный хвост» ситуаций, которых нет в обучающих данных.

Лёгкая, но мощная: 7 миллиардов параметров

При всего 7 миллиардах параметров, Cosmos Reason остаётся достаточно компактной, чтобы работать на разнообразных устройствах:

Промышленные роботы;
Умные камеры и датчики;
Светофоры и системы управления трафиком;
Заводские инструменты и складские системы.

«Каждое умное IoT-устройство, способное видеть, — от камеры до светофора — вскоре будет обладать способностью к рассуждению», — подчеркнул Ле-Баредиан.

Видеоагенты будущего: от фабрик до целых городов

С Cosmos Reason компании могут создавать видеоагентов на основе ИИ — автономных систем, которые:

Анализируют прямые трансляции и архивные записи;
Обнаруживают аномалии (падение человека, остановка конвейера, пробка);
Принимают решения в реальном времени.

Такие агенты могут:

Автоматизировать мониторинг дорожного движения;
Повысить безопасность на промышленных объектах;
Управлять умными городами, предсказывая заторы или аварии.

«Эти видеоагенты скоро будут повсюду, — сказал Ле-Баредиан. — Они превратят пассивные камеры в активных наблюдателей с интеллектом».

Как это работает: два уровня интеллекта

Современные роботы с ИИ полагаются на две технологии:

VLM (модели языка зрения) — понимают инструкции и планируют действия;
Action-Language Models — обеспечивают «мышечную память»: быстрые, автоматизированные реакции.

Cosmos Reason объединяет оба подхода, добавляя уровень рассуждений. Он не просто говорит роботу «возьми чашку» — он помогает понять, почему чашка нужна, где она может быть, и что с ней делать дальше.

Открытый код, закрытое железо

Nvidia объявила, что Cosmos Reason доступен с открытым исходным кодом — разработчики могут скачать и использовать его в своих проектах. Однако модель будет работать только на оборудовании Nvidia, включая:

Jetson Thor DGX — суперкомпьютер для роботов;
RTX Pro 6000, 4000 и 2000 — новые GPU на архитектуре Blackwell, предназначенные для серверов и рабочих станций.

Omniverse и цифровые двойники: тренировка ИИ в виртуальном мире

Cosmos Reason — часть экосистемы Nvidia Omniverse, платформы для создания цифровых двойников реальных объектов и процессов.
В виртуальной среде:

Моделируются заводы, склады, улицы;
Генерируются синтетические данные — миллионы сценариев, которых нет в реальности;
На этих данных обучаются модели вроде Cosmos Reason, чтобы они были готовы к любым, даже самым неожиданным, ситуациям.

Будущее, где всё умеет думать

Cosmos Reason — не просто ещё одна модель ИИ. Это шаг к миру, где каждое «умное» устройство не просто реагирует, а рассуждает.

Представьте:

Светофор, который понимает, что пешеход спешит, и продлевает зелёный;
Промышленный робот, который предугадывает поломку по мельчайшим изменениям вибрации;
Домашний помощник, который готовит завтрак, потому что понял, что вы проснулись и голодны.

«Мы создаём не просто роботов, — говорит Nvidia, — мы создаём машины, наделенные здравомыслием».

Источник: https://www.computerworld.com/article/4037662/nvidias-new-genai-model-helps-robots-think-like-humans.html

Если вам понравился материал, кликните значок — вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал —не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!

13.08.2025 523 0 0