Интересное сегодня
Факторы распространения дезинформации в социальных сетях
Если у вас есть аккаунт в социальной сети, вероятно, вы хотя бы раз делились контентом с вашей сетью...
Как кошки распознают своих хозяев по запаху
Быть владельцем кошки часто нелегко. Большую часть времени кошка, кажется, не хочет иметь с вами нич...
Как старение влияет на социализацию и здоровье мозга
С возрастом наши социальные круги часто уменьшаются. Друзья переезжают, приоритеты смещаются к работ...
Как практиковать экспозиционную терапию при социофобии: поша...
Что такое социофобия и как экспозиционная терапия может помочь Социофобия (социальное тревожное расс...
Разница между полом и гендером: научный подход и терминологи...
Введение в проблему терминологии В 2010 году я опубликовал редакционную статью в American Journal of...
Расстройства аутистического спектра (РАС) и их связь с прежд...
Расстройства аутистического спектра (РАС) Расстройства аутистического спектра (РАС) являются одной и...
Обработка речи как дискретных сигналов
Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.
Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.
Методы и эксперименты
Стимулы и участники
В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.
Регистрация MEG
Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.
- Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
- Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.
Границы восприятия речи
Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.
«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»
Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.