Как социальное неравенство и восприятие партнера влияют на обучение с подкреплением

Как социальное неравенство и восприятие партнера влияют на обучение с подкреплением

Интересное сегодня

Связь функциональной активности сети значимости с самооблада...

Связь функциональной активности сети значимости с самообладанием Взаимодействие сети значимости с це...

Гиперфиксация при СДВГ: что это, признаки и как управлять

Гиперфиксация при СДВГ: что это? Гиперфиксация при СДВГ (синдроме дефицита внимания и гиперактивност...

Антропоморфизм и его влияние на стратегии охраны природы

Антропоморфизм — приписывание человеческих качеств животным — давно оказывает влияние на то, какие в...

Как работают антидепрессанты: ключевые биологические пути ре...

Почему одни люди реагируют на антидепрессанты, а другие — нет? Этот вопрос давно волнует клиницистов...

Факторы риска и взаимосвязь между слабостью, падениями и пси...

Введение Глобальная демографическая ситуация претерпевает значительные изменения: доля пожилых людей...

Как точность приземления влияет на высоту прыжка: исследован...

Компромисс скорости и точности в движениях тела Связь между скоростью и точностью — фундаментальный ...

Рисунок 1: Пример структуры задачи
Рисунок 1: Пример структуры задачи
Рисунок 2: Кривые обучения в исследованиях 1 и 2
Рисунок 2: Кривые обучения в исследованиях 1 и 2
Рисунок 3: Результаты моделирования
Рисунок 3: Результаты моделирования
Рисунок 4: Результаты исследования 3
Рисунок 4: Результаты исследования 3
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Оригинал исследования на сайте автора

Введение

Через опыт люди учатся связывать свои действия с их последствиями, включая понимание того, какие действия в каких ситуациях приносят пользу или убытки. Например, после многократных проб человек может определить, сколько приправы ему нравится в пасте, на каких этажах парковки есть свободные места в выходные или какой тип поста в социальных сетях получает больше всего вовлеченности. Такой тип обучения можно смоделировать с использованием обучения с подкреплением (Reinforcement Learning, RL), которое формализует связь между ожидаемыми и фактическими вознаграждениями через ошибку предсказания вознаграждения (Reward Prediction Error, RPE).

Роль социального контекста в обучении

Хотя исследования обучения с подкреплением традиционно рассматривали вознаграждения как фиксированные (вознаграждение vs. его отсутствие), в последние годы растет интерес к изучению влияния социального контекста на процесс оценки. Например:

  • Социальный контекст может служить источником информации для обучения, включая наблюдательное обучение.
  • Социальные взаимодействия сами по себе могут выступать в роли вознаграждения или наказания (например, улыбка или положительная обратная связь).
  • Восприятие характеристик других людей (таких как теплота и компетентность) влияет на то, как люди оценивают распределение ресурсов.

Методы исследования

В трех исследованиях участники выполняли компьютерную задачу, где им нужно было научиться связывать определенные действия (нажатия кнопок) с вознаграждениями, которые распределялись между ними и другим человеком. Ключевые манипуляции включали:

  • Тип неравенства: участники получали либо большую (выгодное неравенство), либо меньшую (невыгодное неравенство) долю вознаграждения.
  • Идентичность партнера: перед каждым блоком заданий участникам сообщали профессию человека, с которым они делили вознаграждение (например, «медсестра»).
  • Когнитивная нагрузка: в третьем исследовании количество стимулов было уменьшено, чтобы снизить нагрузку на рабочую память.

Результаты

Основные выводы исследований:

Участники учились хуже в условиях невыгодного неравенства, даже когда общее вознаграждение для них оставалось неизменным. Это указывает на то, что социальное сравнение играет ключевую роль в процессе обучения.

Обсуждение

Результаты показывают, что неравенство в распределении вознаграждений влияет на обучение «абсолютно», а не относительно. Это означает, что невыгодное неравенство снижает ценность вознаграждений даже без сравнения с выгодными условиями. Кроме того, восприятие теплоты и компетентности партнера оказывает более систематическое влияние на обучение при сниженной когнитивной нагрузке.

Ограничения

Исследование имеет несколько ограничений:

  • Вознаграждения были гипотетическими, что может снижать силу эффектов.
  • Участники — молодые взрослые из США, что ограничивает обобщаемость результатов.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода