Интересное сегодня
Как аудиальные и визуальные стимулы влияют на восприятие вре...
Введение Долгое время известно, что аудиальные стимулы воспринимаются как более длительные по сравне...
Метапознание: Искусство принимать мудрые решения в условиях ...
Размышления о мышлении: Ключ к мудрым решениям Представьте себя на перепутье: одна дорога ведет к с...
Как ИИ способствует нечестному поведению: исследование морал...
Моральная дистанция: как ИИ облегчает нечестное поведение Обширные исследования в области behaviora...
Влияние температуры горячего воздуха и толщины ломтиков на к...
Введение Дыня Хами (Канталупа) — популярный фрукт, выращиваемый в тропических регионах и имеющий ком...
Метод распознавания именованных сущностей в психомедицине на...
Основные аспекты метода распознавания именованных сущностей (NER) Распознавание именованных сущносте...
Как вредная еда влияет на мозг: научное исследование
Как вредная еда влияет на мозг С приближением бейсбольного сезона я с нетерпением жду возможности по...
Введение
В данной статье представлено элементарное объяснение математического вклада Бернарда Маскита в теорию множественного кодирования (Bucci, 2021), а также проблемы передачи эмоционального (невербального) опыта с помощью языка с точки зрения психолингвистики. Совместно со своей женой и соавтором Вильмой Буччи, Маскит сделал множество значительных открытий в этой области. Его математический подход, включая введение техники сглаживания, позволил разработать ряд важных метрик, которые значительно продвинули теорию.
Основные концепции
На простейшем уровне сглаживание позволяет анализировать текст не по отдельным словам, а с учётом значений соседних слов. Это придаёт анализу дектический аспект — каждое слово оценивается в контексте окружающих его элементов. Данный метод был применён в программе анализа атрибутов дискурса (Discourse Attributes Analysis Program, DAAP) и при определении таких метрик, как:
- Среднее высокое значение WRAD (Mean High WRAD)
- Доля высоких значений WRAD (High WRAD Proportion)
- Ковариация между различными показателями
Метод сглаживания
Оператор сглаживания, разработанный Маскитом, использует словарь, присваивающий каждому слову числовое значение. Существует два типа словарей:
- Взвешенные словари (например, WRAD и WRRL) — каждому слову присваивается уникальное числовое значение.
- Невесомые словари — слова либо получают фиксированное значение, либо нейтральное, если их нет в словаре.
Работа с окнами данных
Для сглаживания текста выбирается размер окна — количество слов вокруг текущего, которые учитываются при расчёте среднего. Например, при окне размером 7 (m=4) для слова "must" в тексте будут учтены 3 слова слева и 3 справа. Значения этих слов усредняются с весами, которые уменьшаются по мере удаления от центрального слова.
«Сглаживание позволяет увидеть „тренд“ данных, который сложно заметить при анализе отдельных слов» — Бернард Маскит.
Приложения метода
Сглаживание применяется для:
- Сравнения эмоциональной нагрузки текста по разным словарям (ковариация).
- Вычисления средних значений и дисперсии.
- Анализа психологических переменных, таких как вовлечённость и реорганизация мыслей.
Пример: анализ песни "Long Black Veil"
На графиках (Рис. 1–6) показано, как сглаживание делает колебания данных менее резкими, выделяя общие тенденции. Например, при сравнении WRAD и WRRL видно, что их значения часто противоположны, что отражается в отрицательной ковариации.