Как обнаружить встроенную ложь с помощью компьютерного анализа текста

Как обнаружить встроенную ложь с помощью компьютерного анализа текста

Интересное сегодня

ADHD паралич: почему вы чувствуете себя застрявшим и как пре...

Что такое ADHD паралич? ADHD паралич — это неофициальный термин, описывающий состояние, когда челове...

Как позитивное восприятие тела во время беременности влияет ...

Влияние восприятия тела во время беременности на психическое здоровье Беременность часто изображают ...

Математический анализ эмоционального содержания текста: мето...

Введение В данной статье представлено элементарное объяснение математического вклада Бернарда Маскит...

Как дендритные нелинейности объясняют эффект маскировки плит...

Кризис стандартной модели пространственного зрения Пространственное зрение как область исследований ...

Розыгрыш билетов на SpaFest 2025: незабываемый уикенд для зд...

Хотите ощутить прилив энергии и полностью перезагрузиться? У вас есть шанс выиграть незабываемый уик...

Как адаптация влияет на восприятие малых количеств: исследов...

Восприятие численности и механизм субтизинга Люди и многие животные демонстрируют способность воспри...

рисунок 2
рисунок 2
рисунок 3
рисунок 3
рисунок 1
рисунок 1
Thumbnail 1
Thumbnail 2
Thumbnail 3
Оригинал исследования на сайте автора

Введение

Каждый человек ежедневно сталкивается с различными формами обмана. Однако вместо полного вымысла люди чаще комбинируют правдивые и ложные элементы в своих высказываниях. Эта стратегия известна как встроенная ложь. Встроенная ложь представляет собой уникальную проблему для исследований обмана и остается малоизученным явлением.

Детекция вербального обмана

Традиционные методы детекции лжи, такие как Criteria-Based Content Analysis (CBCA) и Reality Monitoring (RM), основаны на ручном анализе вербальных маркеров. CBCA оценивает правдоподобность утверждений на основе таких критериев, как количество деталей и спонтанные исправления. RM фокусируется на сенсорных и контекстных деталях, которые чаще встречаются в правдивых рассказах. Однако эти методы требуют значительных временных затрат и экспертных знаний.

Автоматизированная детекция обмана

Современные методы Natural Language Processing (NLP) и машинного обучения позволяют автоматизировать процесс детекции лжи. Например, инструменты типа Linguistic Inquiry and Word Count (LIWC) анализируют частоту слов, связанных с психологическими и социальными аспектами. Трансформерные модели, такие как BERT и Llama3, используют контекстные эмбеддинги для классификации высказываний.

Встроенный обман

Исследования показывают, что лжецы часто используют элементы из личного опыта, чтобы сделать свою ложь более правдоподобной. Например, в некоторых исследованиях 67-86% участников включали в свои ложные утверждения детали из реальных событий. Однако большинство работ по детекции лжи сосредоточены на полностью вымышленных историях, игнорируя континуум между правдой и ложью.

Выявление встроенной лжи

Несмотря на признание важности встроенной лжи, лишь немногие исследования изучали её природу и методы обнаружения. Например, анализ нграмм показал, что встроенная ложь часто не отличается от правдивых утверждений по частоте слов. Это делает её обнаружение особенно сложным.

Текущее исследование

В данной работе представлен новый набор данных из 2084 утверждений (правдивых и содержащих встроенную ложь), собранных в рамках внутрисубъектного эксперимента. Участники описывали одно и то же событие дважды: правдиво и с включением ложных элементов. Затем они отмечали, какие части высказывания были ложными, и оценивали их значимость.

Результаты

  • В среднем, в ложных утверждениях содержалось 5 встроенных лжей, что составляло около 1/3 от общего объема текста.
  • Большинство ложных элементов основывались на личном опыте (46.27%) или воображении (33.86%).
  • Женщины оценивали свою ложь как более обманчивую, чем мужчины.
  • Лингвистический анализ выявил небольшие различия между правдивыми и ложными утверждениями.

Прогностическое моделирование

Точность классификации утверждений с помощью модели Llama3 составила 64%. Однако встроенная ложь оставалась сложной для обнаружения из-за её сходства с правдивыми высказываниями.

Заключение

Это исследование подчеркивает сложность обнаружения встроенной лжи и необходимость дальнейших разработок в области автоматизированной детекции обмана. Представленный набор данных может стать ценным ресурсом для будущих исследований.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода