Как социальное неравенство и восприятие партнера влияют на обучение с подкреплением

Интересное сегодня

Влияние проблемного использования социальных сетей и игр на ...

Введение С быстрым развитием доступа в интернет и технологий, социальные сети и онлайн игры приобрел...

Как мозг фильтрует звуки: исследование короллярных разрядов

Введение Исследователи проследили, как мозг фильтрует фоновый шум в процессе речи, используя сигналы...

Влияние эмоций на финансовые решения мужчин и женщин

Введение Согласно новому исследованию, проведенному университетом Эссекса, мужчины значительно чаще,...

Влияние когнитивной нагрузки на консолидацию и реконсолидаци...

Влияние когнитивной нагрузки на консолидацию и реконсолидацию воспоминаний об угрозе Введение Эксп...

Парадоксальные гендерные различия в потреблении мяса в разны...

Введение Потребление мяса представляет серьёзную угрозу для экологии, здоровья людей и благополучия ...

Политическая идеология и сотрудничество: как левые и правые ...

Введение: политическая идеология и социальные дилеммы Люди в современных обществах постоянно сталкив...

Рисунок 1: Пример структуры задачи

Рисунок 2: Кривые обучения в исследованиях 1 и 2

Рисунок 3: Результаты моделирования

Рисунок 4: Результаты исследования 3

Оригинал исследования на сайте автора

Введение

Через опыт люди учатся связывать свои действия с их последствиями, включая понимание того, какие действия в каких ситуациях приносят пользу или убытки. Например, после многократных проб человек может определить, сколько приправы ему нравится в пасте, на каких этажах парковки есть свободные места в выходные или какой тип поста в социальных сетях получает больше всего вовлеченности. Такой тип обучения можно смоделировать с использованием обучения с подкреплением (Reinforcement Learning, RL), которое формализует связь между ожидаемыми и фактическими вознаграждениями через ошибку предсказания вознаграждения (Reward Prediction Error, RPE).

Роль социального контекста в обучении

Хотя исследования обучения с подкреплением традиционно рассматривали вознаграждения как фиксированные (вознаграждение vs. его отсутствие), в последние годы растет интерес к изучению влияния социального контекста на процесс оценки. Например:

Социальный контекст может служить источником информации для обучения, включая наблюдательное обучение.
Социальные взаимодействия сами по себе могут выступать в роли вознаграждения или наказания (например, улыбка или положительная обратная связь).
Восприятие характеристик других людей (таких как теплота и компетентность) влияет на то, как люди оценивают распределение ресурсов.

Методы исследования

В трех исследованиях участники выполняли компьютерную задачу, где им нужно было научиться связывать определенные действия (нажатия кнопок) с вознаграждениями, которые распределялись между ними и другим человеком. Ключевые манипуляции включали:

Тип неравенства: участники получали либо большую (выгодное неравенство), либо меньшую (невыгодное неравенство) долю вознаграждения.
Идентичность партнера: перед каждым блоком заданий участникам сообщали профессию человека, с которым они делили вознаграждение (например, «медсестра»).
Когнитивная нагрузка: в третьем исследовании количество стимулов было уменьшено, чтобы снизить нагрузку на рабочую память.

Результаты

Основные выводы исследований:

Участники учились хуже в условиях невыгодного неравенства, даже когда общее вознаграждение для них оставалось неизменным. Это указывает на то, что социальное сравнение играет ключевую роль в процессе обучения.

Обсуждение

Результаты показывают, что неравенство в распределении вознаграждений влияет на обучение «абсолютно», а не относительно. Это означает, что невыгодное неравенство снижает ценность вознаграждений даже без сравнения с выгодными условиями. Кроме того, восприятие теплоты и компетентности партнера оказывает более систематическое влияние на обучение при сниженной когнитивной нагрузке.

Ограничения

Исследование имеет несколько ограничений:

Вознаграждения были гипотетическими, что может снижать силу эффектов.
Участники — молодые взрослые из США, что ограничивает обобщаемость результатов.

Короткие версии статей можно найти в телеграм-канале.