Как языковые модели искажают результаты тестов личности

Как языковые модели искажают результаты тестов личности

Интересное сегодня

Защитные факторы против родительского выгорания во время пан...

Введение Пандемия COVID-19 оказала негативное влияние на семьи по всему миру, увеличив вероятность р...

Психологические факторы предотвращения самоубийств в Индонез...

Введение Всемирная организация здравоохранения (ВОЗ, 2014) признает самоубийство глобальной проблемо...

Влияние физической активности на мотивацию изучения китайско...

Введение С начала 1970-х годов мотивация для изучения второго или иностранного языка стала одной из ...

Влияние художественной красоты на абстрактное мышление

Влияние художественной красоты на наше мышление С начала философских размышлений, начиная от Плат...

Анализ симптомов тревоги у пациентов с хронической обструкти...

Введение Целью данного исследования является изучение классов симптомов тревоги у пациентов, страдаю...

Роль восприятия понимания в отношениях между подростками и р...

Важность восприятия понимания Восприятие понимания — это восприятие людьми степени, в которой другие...

Оригинал исследования на сайте автора
Читать короткую версию
Кликните еще раз для перехода

Введение

Языковые модели (ЯМ), такие как GPT-4, могут быстро распознать, когда им задают тест личности, и подстраивают свои ответы так, чтобы они казались более социально желательными. Это открытие имеет важные последствия для использования ЯМ в качестве заменителей людей в научных исследованиях. В ходе эксперимента исследователи, включая Аадеша Салеча и его коллег, провели классический тест личностей «Большой пятерки», который оценивает экстраверсию, открытость опыту, сознательность, дружелюбие и невротизм.

Подход

Исследователи обнаружили, что ЯМ, как и люди, склонны искажать свои ответы, чтобы казаться более привлекательными, что называется «предвзятостью социальной желаемости». Эти модели показали значительное смещение в ответах: например, в тесте «Большой пятерки» при увеличении числа вопросов шкала позитивных черт возросла более чем на одну стандартную девиацию, а оценка невротизма снизилась на аналогичное значение. Это эквивалентно общению с обычным человеком, который вдруг начинает демонстрировать личность, более приятную, чем у 85% населения.

  • Предвзятость, обнаруженная в моделях: Языковые модели корректируют ответы на тесты личности, чтобы выглядеть более привлекательными.
  • Магнитуда эффекта: Ответы GPT-4 изменились существенно, подражая идеализированной личности.
  • Влияние человека: Языковые модели «учатся» социальной желаемости через человеческую обратную связь в процессе обучения.

Заключение

Авторы отмечают, что ЯМ понимают, какие личностные черты считаются социально желательными, что позволяет моделям подражать этим чертам, когда они оцениваются. Это открытие указывает на значительные ограничения в использовании ЯМ для психометрических тестов и подчеркивает необходимость осторожного подхода к использованию этих моделей в качестве замены человеческим участникам в психических исследованиях.

Значение исследования: Языковые модели имеют социальные предвзятости, что ставит под сомнение их использование в качестве заменителей людей в научных исследованиях.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода