Могут ли CNN имитировать человеческое восприятие? Исследование принципа Замыкания в нейросетях

Могут ли CNN имитировать человеческое восприятие? Исследование принципа Замыкания в нейросетях

Интересное сегодня

Неинвазивная стимуляция вентромедиальной префронтальной коры...

Введение в проблему принятия решений Люди склонны считать себя рациональными существами, способными ...

Нарушения исполнительных функций и пищевая зависимость у под...

Введение Ожирение среди детей и подростков представляет собой растущую проблему общественного здраво...

Анорексия и ПТСР: Личный опыт принудительного лечения

Введение Анорексия нервоза (АН) — это сложное расстройство, обусловленное биопсихосоциальными...

Как Глазные Сигналы Улучшают Непреднамеренное Обучение У Дет...

ВведениеС ранних этапов развития люди используют глаза для обучения о окружающей их среде. Например,...

Интеллектуальная одаренность и перевозбужденные состояния

Интеллектуальная одаренность обычно воспринимается как благо, и действительно, она приносит множеств...

Когнитивная гибкость и развитие культурного обучения у детей

Введение Масштабы кумулятивной культурной эволюции (ККЕ) являются отличительной чертой человечества...

figure 1
figure 1
figure 2
figure 2
figure 3
figure 3
figure 4
figure 4
figure 5
figure 5
figure 6
figure 6
figure 7
figure 7
figure 8
figure 8
figure 9
figure 9
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Thumbnail 5
Thumbnail 6
Thumbnail 7
Thumbnail 8
Thumbnail 9
Оригинал исследования на сайте автора
Читать короткую версию
Кликните еще раз для перехода

Ограничения искусственного интеллекта в сравнении с человеческим восприятием

Задачи, которые люди выполняют интуитивно, остаются сложными для моделей искусственного интеллекта (ИИ), несмотря на их растущую интеграцию в различные области. Способность нейронных сетей ошибаться, например, при распознавании текстурированного изображения кошки как слона (Geirhos et al., 2018), подчеркивает их ограничения по сравнению с возможностями человеческого мозга. В то время как люди легко распознают лица, даже незначительные искажения в изображении могут обмануть нейронную сеть (Szegedy et al., 2013; Goodfellow et al., 2015), демонстрируя значительный разрыв в имитации человеческого зрительного восприятия.

Гештальт-принципы и роль Замыкания

Важным этапом в изучении зрительного восприятия стало развитие принципов перцептивной группировки, известных как «Законы Гештальта» (Wertheimer, 1938; Palmer, 2002; Wagemans et al., 2012a; Wagemans, 2018). Эти принципы объясняют, как наблюдатели склонны воспринимать определенные элементы как связанные, а другие — как отдельные. Среди них принцип Замыкания утверждает, что люди воспринимают незавершенные формы как цельные, формируя связное изображение. Это происходит благодаря завершению контура, которое может быть амодальным (когда объект воспринимается за перекрывающим элементом) или модальным (когда характеристики стимула создают иллюзорный контур).

Методология исследования

Наше исследование сосредоточено на CNN по двум основным причинам. Во-первых, это позволяет устранить пробелы, выявленные в предыдущих исследованиях, особенно противоречивые результаты относительно их способности выполнять Замыкание. Во-вторых, CNN работают иначе, чем другие нейронные сети, такие как Vision Transformers (ViTs), которые используют механизмы внимания. Учитывая сложную взаимосвязь между вниманием и перцептивной группировкой в человеческом мозге (Wu et al., 2023), ViTs требуют отдельного изучения.

Эксперимент 1: Метод, основанный на сходстве

Первый эксперимент основан на работе Kim et al. (2021), которые показали, что CNN, обученные классификации естественных изображений, действительно выполняют Замыкание. Мы воспроизводим их исследование, внося два изменения в набор данных и расширяя методологию на более широкий спектр CNN. Основное внимание уделяется завершению сегментов треугольника с использованием фрагментов краев.

  • Набор данных: Содержит 992 изображения, разделенных на три группы: полные треугольники, выровненные фрагменты и хаотичные фрагменты.
  • Измерение: Используется косинусное сходство для оценки эффекта Замыкания.

Обсуждение результатов и выводы

Результаты показывают, что CNN демонстрируют различную способность к выполнению Замыкания в зависимости от архитектуры и типа стимулов. VGG16 и DenseNet-121 последовательно используют принцип Замыкания, в то время как другие модели, такие как AlexNet и ResNet-50, показывают лучшие результаты при использовании метода, основанного на конфигурационных эффектах (CE).

«Если CNN могут имитировать человеческое восприятие без рекуррентных связей, это значительный шаг в понимании группировки информации в нейросетях»

Наши выводы подчеркивают, что CNN обладают более сильными способностями к амодальному завершению, чем к модальному. Это может объяснить, почему некоторые модели демонстрируют эффект Замыкания для сегментов линий, но не для фигур Канзи. Будущие исследования могут быть направлены на обучение CNN выполнению Замыкания для улучшения их производительности и устойчивости к атакам.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода

Клиофит Эликсир 100 мл — раствор для здоровья почек

Клиофит Эликсир оралный спиртовой раствор 100 мл поддерживает здоровье почек и мочевыводящих путей. ...

Цетрин 10 мг №20 – таблетки от аллергии

Цетрин 10 мг №20 – эффективное антигистаминное средство для снятия симптомов аллергии: ринита, конъю...

Белобаза крем 100г — уход за чувствительной кожей

Белобаза крем — эффективное увлажняющее и защитное средство для чувствительной кожи. Подходит для еж...

Серная мазь 30г: средство для кожи, антисептик, цена

Серная мазь простая 30 г — проверенное средство для борьбы с кожными проблемами: угрями, себореей, д...

Белодерм мазь 0,05% 30 г — купить в аптеке

Белодерм мазь 0,05% в тубе 30 г — средство для наружного применения на основе бетаметазона дипропион...

Подгузники Merries 6-11 кг №64 - дышащие, против опрелостей

Подгузники Merries для детей 6-11 кг с уникальной технологией трёх дышащих слоёв. Предотвращают опре...