Интересное сегодня
Эффективная поддержка при СДВГ: как когнитивно-поведенческая...
Комплексный подход к поддержке детей с СДВГ: больше чем просто медикаменты Для многих семей жизнь с...
Дисциплина для малышей и детей ясельного возраста: предотвра...
Малыши и дети ясельного возраста могут быть милыми, но иногда они делают вещи, которые могут вызвать...
Как справиться с тревогой перед работой: причины, симптомы и...
Почему работа вызывает тревогу? Чувство лёгкого волнения перед рабочим днём — это нормально. Но если...
Почему он так быстро влюбляется: признаки любви или манипуля...
Почему он так быстро влюбляется? Вы знакомитесь с мужчиной, и между вами мгновенно возникает связь. ...
Психологическая поддержка молодежи: опыт Headspace в Дании
Введение в проблему психического здоровья молодежи В последние десятилетия наблюдается пугающая тенд...
Пьер Жане: основатель клинической психологии и теории психич...
Пьер Жане: ключевая фигура в истории психологии Пьер Жане (1859–1947) был выдающимся французским нев...
Введение в проблему аудиовизуального восприятия
Понимание того, как человеческий слух обрабатывает речь в сложных аудиовизуальных (АВ) средах, является фундаментальной задачей для современной когнитивной психологии и аудиологии. В повседневной жизни мы постоянно сталкиваемся с ситуациями, где визуальная информация (движения губ, мимика говорящего) неразрывно связана со звуковым потоком. Данное исследование было направлено на то, чтобы раскрыть механизмы, с помощью которых характеристики аудиовизуальной сцены формируют перцептивное представление целевого говорящего в условиях фонового шума.
Аудиовизуальная среда и восприятие
Когда мы находимся в шумном помещении, наш мозг использует визуальные сигналы для фильтрации и усиления звуков нужного источника. В рамках эксперимента 25 взрослых участников с нормальным слухом оценивали воспринимаемую громкость женской речи на фоне «шума из четырех говорящих» (multitalker babble). Важным параметром стало соотношение целевого сигнала к маскирующему (Target-to-Masker Ratio, TMR) — это научный термин, обозначающий разницу в уровне громкости между полезным сигналом и фоновым шумом, измеряемую в децибелах (дБ).
Лингвистическая значимость и физическая интенсивность
Исследование включало использование трех лингвистических типов стимулов: реальные слова, псевдослова (наборы звуков, имитирующие структуру языка) и слова, воспроизведенные в обратном порядке. Интересно, что при идентичной физической интенсивности звука, участники субъективно оценивали слова как более громкие, чем бессмысленные звуковые последовательности. Это подтверждает гипотезу о том, что мозг активно интегрирует языковой контекст в процесс восприятия громкости.
Влияние аудиовизуальной временной синхронности
Одним из ключевых факторов исследования стала временная задержка между аудио- и видеорядом. Мы манипулировали этим показателем через SOA (Stimulus Onset Asynchrony — асинхронность начала стимулов). Задержки варьировались от 0 до 500 миллисекунд (мс).
«Нарушение временной связности между тем, что мы слышим, и тем, что мы видим, приводит к заметному снижению субъективной громкости целевого говорящего, даже если уровень звука остается неизменным» — отмечают авторы исследования.
Критические пороги восприятия
Анализ показал, что критический порог, после которого происходит существенное падение восприятия громкости, находится в диапазоне 150–300 мс. При задержке в 500 мс наблюдалось снижение воспринимаемого TMR примерно на 2–3 дБ для всех типов лингвистических стимулов. Это означает, что для головного мозга «распад» аудиовизуальной картины напрямую влияет на эффективность обработки речевой информации.
Разделение механизмов восприятия
Результаты позволяют сделать важный вывод: хотя как синхронность, так и лингвистический контент влияют на восприятие, их вклад в этот процесс можно рассматривать как независимые переменные. Мы разработали метод отображения оценок громкости на изменения воспринимаемого TMR, что позволило отделить лингвистический эффект от эффекта временной рассинхронизации. Это дает уникальный взгляд на то, как перцептивная конструкция громкости меняется в зависимости от аудиовизуальной сцены.
Значение для аудиологии и коммуникации
Данное исследование имеет важное прикладное значение:
- Улучшение слуховых аппаратов: Понимание задержек обработки сигналов помогает создавать более естественные настройки для устройств компенсации слуха.
- Анализ акустических сцен: Изучение того, как мозг группирует аудиовизуальные объекты, помогает в разработке систем распознавания речи в шумных средах.
- Коммуникация: Результаты объясняют, почему при плохой синхронизации видео и звука (например, при трансляциях или видеозвонках) речь кажется нам «тише» и сложнее для восприятия, что заставляет нас напрягаться сильнее.
Исследование подчеркивает, что восприятие громкости — это не просто физическая реакция на амплитуду звуковой волны, а сложный динамический процесс, объединяющий визуальные данные, лингвистический опыт и временную точность. Дальнейшее изучение этих механизмов позволит более глубоко понять природу человеческого общения в цифровой и реальной среде.