Сравнение использования вероятностных фраз человеком и GPT-4 в координационной игре

Сравнение использования вероятностных фраз человеком и GPT-4 в координационной игре

Интересное сегодня

Физическая активность и предупреждение депрессии у подростко...

Введение Долгосрочное исследование, проведенное Норвежским университетом науки и технологии (NTNU), ...

Исследование ЭЭГ в состоянии покоя: отсутствие надежных биом...

Исследование ЭЭГ в состоянии покоя: отсутствие надежных биомаркеров латерализации тиннитуса Настоящ...

Нарциссизм лидера и девиантное поведение на рабочем месте: к...

Введение в проблему нарциссизма в лидерстве Нарциссизм привлекает внимание исследователей, поскольку...

Интенсивные дружбы у аутистов: причины, вызовы и как ими упр...

Интенсивные дружбы у аутичных людей У аутичных людей часто формируются интенсивные дружеские отношен...

Почему люди откладывают уплату налогов и как с этим справить...

Введение Как и Рождество или Новый год, День налогов приходит каждый год, и этот год не исклю...

Старение и принятие решений: новые исследования развенчивают...

Старение и принятие решений Новое исследование, проведенное учеными из SWPS University, опровергает ...

Рисунок 1
Рисунок 1
Рисунок 2
Рисунок 2
Рисунок 3
Рисунок 3
Рисунок 4
Рисунок 4
Рисунок 5
Рисунок 5
Рисунок 6
Рисунок 6
Рисунок 7
Рисунок 7
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Thumbnail 5
Thumbnail 6
Thumbnail 7
Thumbnail 8
Thumbnail 9
Thumbnail 10
Оригинал исследования на сайте автора

Введение

Английский язык богат вероятностными фразами, такими как «вероятно» или «возможно», которые используются для передачи информации о вероятности событий. Успешная коммуникация зависит от того, насколько точно слушатель понимает, что хочет сказать говорящий. В этом исследовании мы сравниваем, как люди и GPT-4 (Large Language Model от OpenAI) интерпретируют такие фразы в координационной игре.

Координационная игра

Координационная игра — это ситуация, где два участника должны согласовать свои действия на основе общих знаний о неопределенности. В нашем случае первый участник (например, врач или финансовый консультант) использует вероятностную фразу, а второй (человек или GPT-4) оценивает, какую вероятность или неоднозначность она передает.

Методы

Мы провели два эксперимента: один в контексте медицинских советов, другой — инвестиционных. Участники (25 человек в каждом контексте) и GPT-4 оценивали 23 вероятностные фразы по шкале от 0% до 100%.

Оценка вероятности и неоднозначности

Участники сначала оценивали вероятность, а затем неоднозначность (размытость) каждой фразы. GPT-4 выполнял те же задачи, но мы анализировали только его первый ответ, чтобы избежать искажений.

Результаты

1. Сравнение оценок вероятности

GPT-4 показал результаты, близкие к медианным человеческим оценкам, но с небольшими систематическими отклонениями. В обоих контекстах человеческие оценки были «сжаты» относительно GPT-4 на коэффициент ~0.8.

2. Сравнение оценок неоднозначности

Здесь различия были более заметны: человеческие оценки сжимались в 2 раза относительно GPT-4. Однако, поскольку нет стандартной шкалы неоднозначности, это может отражать разницу в интерпретации.

3. Влияние контекста

И люди, и GPT-4 демонстрировали схожие оценки вероятности в медицинском и инвестиционном контекстах. Это означает, что фраза «вероятно» передает одинаковую информацию в обоих случаях.

Выводы

GPT-4 успешно справляется с координационной игрой, но его оценки вероятности и неоднозначности отличаются от человеческих. Эти различия могут быть связаны с когнитивными искажениями у людей. Методы на основе координационных игр полезны для оценки возможностей языковых моделей.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода

Vichy Homme Дезодорант для чувствительной кожи - 48ч защита

Дезодорант Vichy Homme для чувствительной кожи обеспечивает 48-часовую защиту от пота без раздражени...

Компрессионный наколенник Унга-Рус №3 - лечение артроза

Компрессионный наколенник Унга-Рус №3 — медицинский трикотажный бандаж для лечения артрита, артроза,...

President Generation Z мягкая зубная щетка

Зубная щетка President Generation Z с мягкой щетиной бережно очищает зубы и десны, удаляя налёт без ...

Аква Марис Аспиратор для детей — 4 сменные насадки

Аква Марис Аспиратор назальный для детей с набором из 4 сменных насадок помогает мягко и безопасно у...

Акридерм Гента мазь 15 г — купить для лечения кожи

Мазь Акридерм Гента — эффективное комбинированное средство для наружного применения. Содержит бетаме...

Синупрет капли 100 мл – лечение синусита, растительный препа...

Синупрет капли для внутреннего применения 100 мл помогают при острых и хронических синуситах с образ...