Каждый день мы без усилий узнаем знакомые объекты, даже если их контуры частично скрыты или искажены. Эта способность, известная как контурная интеграция, позволяет мозгу собирать фрагменты и формировать целостные образы. Например, мы легко можем распознать лицо друга в толпе или чашку на кухонной полке, даже если они не видны полностью. Это свойство нашего восприятия представляет собой ключевой элемент человеческой зрительной системы, который до сих пор представляет сложность для искусственного интеллекта.
Несмотря на успехи искусственного интеллекта в области распознавания изображений, современные модели ИИ все еще сталкиваются с проблемами, когда речь идет о неполных или фрагментированных изображениях. Когда объекты скрыты, стерты или разобраны на части, большинство ИИ-систем дают сбой, неправильно классифицируя или не распознавая такие объекты. Это ограничивает применение ИИ в реальных задачах, таких как беспилотные автомобили, медицинская визуализация или робототехника, где важна способность справляться с частично скрытыми или поврежденными объектами.
Исследовательская группа под руководством Мартина Шримпфа из NeuroAI Lab в EPFL провела систематическое исследование, чтобы понять, как люди и ИИ решают задачи по распознаванию объектов с фрагментированными контурами. В ходе эксперимента 50 добровольцев и более 1000 моделей искусственного интеллекта должны были идентифицировать повседневные объекты, такие как чашки, шляпки и сковородки, на изображениях, где контуры объектов были частично стираны или разбиты на сегменты. В некоторых случаях оставалось видно лишь 35% контуров.
Результаты исследования продемонстрировали, что люди показывают исключительные результаты, достигая 50% точности, даже когда большая часть контуров скрыта. Напротив, большинство ИИ-моделей с трудом справлялись с такими задачами и часто прибегали к случайному угадыванию, если изображение было фрагментировано. Только модели, обученные на миллиардах изображений, смогли приблизиться к уровням точности, сравнимым с человеческими. Однако даже эти модели требовали дополнительной настройки для конкретных условий эксперимента.
Исследование также выявило, что люди склонны интерпретировать фрагменты объектов, когда части контуров указывают в одном направлении, что было названо смещением интеграции. ИИ-системы, обученные с учетом этого смещения, продемонстрировали улучшенные результаты при распознавании искаженных изображений. Это подчеркивает, что контурная интеграция не является врожденной чертой, а может развиваться с опытом, что открывает новые перспективы для обучения ИИ.
Результаты работы подтверждают, что лучший способ преодолеть этот разрыв между людьми и ИИ — это не модификация архитектуры искусственного интеллекта, а обучение на «человеческих» данных, включая изображения, где объекты часто скрыты или частично разрушены. Это поможет ИИ адаптироваться к реальной жизни, где мы сталкиваемся с фрагментированными или неполными изображениями.
Источник: https://techxplore.com/news/2025-07-humans-excel-fragments-ai-struggles.htmlЕсли вам понравился материал, кликните значок - вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал - не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!