Как мозг обрабатывает речь: временные окна восприятия звуков

Как мозг обрабатывает речь: временные окна восприятия звуков

Интересное сегодня

История Сары: Выбор видеть мир лучше

Однажды польская еврейка по имени Сара рассказала мне эту историю: В начале Второй мировой войны, ко...

Лимбическая система: структура, функции и влияние на психиче...

Что такое лимбическая система? Лимбическая система — это сложная сеть взаимосвязанных структур мозга...

Как время приёма флуоксетина (Прозак) влияет на психическое ...

Как время приёма флуоксетина влияет на психическое здоровье Новое исследование, опубликованное в жур...

Синхронизация мозговой активности при визуальном контакте: с...

Введение С развитием пандемии коронавирусной болезни 2019 онлайн-встречи стали неотъемлемой частью о...

Улучшение когнитивных функций после реваскуляризации сонных ...

Значение атеросклероза сонных артерий Пациенты с атеросклерозом сонных артерий находятся под риском ...

Дети родителей с шизофренией или биполярным расстройством: р...

Дети родителей с шизофренией или биполярным расстройством: риски и защитные факторы Новое долгосроч...

figure 1
figure 1
figure 2
figure 2
figure 3
figure 3
figure 4
figure 4
figure 5
figure 5
figure 6
figure 6
figure 7
figure 7
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Thumbnail 5
Thumbnail 6
Thumbnail 7
Thumbnail 8
Thumbnail 9
Thumbnail 10
Оригинал исследования на сайте автора

Обработка речи как дискретных сигналов

Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.

Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.

Методы и эксперименты

Стимулы и участники

В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.

Регистрация MEG

Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.

  • Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
  • Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.

Границы восприятия речи

Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.

«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»

Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода