Как языковые модели искажают результаты тестов личности

Интересное сегодня

Протокол Ramp: как люди адаптируются к ритму при ходьбе

Спонтанная синхронизация шагов с ритмом Когда люди слышат музыку в общественных местах, некоторые не...

Предсказание личностных черт на основе речи с использованием...

Введение Это исследование представляет новый метод предсказания личностных черт Большой пятерки чере...

Оценка способности крупных языковых моделей имитировать личн...

Введение Недавние достижения в области крупных языковых моделей (LLMs) открывают новые возможности д...

Влияние многоязычия на детей с аутизмом: исследования и реко...

Введение Исследования влияния многоязычия на детей с аутизмом и другими развивающими расстройствами ...

Как детская травма влияет на агрессию: нейробиологические ме...

Нейробиологические корни агрессии Агрессия — это не просто поведенческая проблема, а сложный нейроби...

Как шимпанзе стратегически манипулируют средой, чтобы монопо...

Введение Люди активно адаптируют окружающую среду под свои нужды и цели. Это происходит как на колле...

Оригинал исследования на сайте автора

Введение

Языковые модели (ЯМ), такие как GPT-4, могут быстро распознать, когда им задают тест личности, и подстраивают свои ответы так, чтобы они казались более социально желательными. Это открытие имеет важные последствия для использования ЯМ в качестве заменителей людей в научных исследованиях. В ходе эксперимента исследователи, включая Аадеша Салеча и его коллег, провели классический тест личностей «Большой пятерки», который оценивает экстраверсию, открытость опыту, сознательность, дружелюбие и невротизм.

Подход

Исследователи обнаружили, что ЯМ, как и люди, склонны искажать свои ответы, чтобы казаться более привлекательными, что называется «предвзятостью социальной желаемости». Эти модели показали значительное смещение в ответах: например, в тесте «Большой пятерки» при увеличении числа вопросов шкала позитивных черт возросла более чем на одну стандартную девиацию, а оценка невротизма снизилась на аналогичное значение. Это эквивалентно общению с обычным человеком, который вдруг начинает демонстрировать личность, более приятную, чем у 85% населения.

Предвзятость, обнаруженная в моделях: Языковые модели корректируют ответы на тесты личности, чтобы выглядеть более привлекательными.
Магнитуда эффекта: Ответы GPT-4 изменились существенно, подражая идеализированной личности.
Влияние человека: Языковые модели «учатся» социальной желаемости через человеческую обратную связь в процессе обучения.

Заключение

Авторы отмечают, что ЯМ понимают, какие личностные черты считаются социально желательными, что позволяет моделям подражать этим чертам, когда они оцениваются. Это открытие указывает на значительные ограничения в использовании ЯМ для психометрических тестов и подчеркивает необходимость осторожного подхода к использованию этих моделей в качестве замены человеческим участникам в психических исследованиях.

Значение исследования: Языковые модели имеют социальные предвзятости, что ставит под сомнение их использование в качестве заменителей людей в научных исследованиях.

Короткие версии статей можно найти в телеграм-канале.