
Интересное сегодня
История Сары: Выбор видеть мир лучше
Однажды польская еврейка по имени Сара рассказала мне эту историю: В начале Второй мировой войны, ко...
Лимбическая система: структура, функции и влияние на психиче...
Что такое лимбическая система? Лимбическая система — это сложная сеть взаимосвязанных структур мозга...
Как время приёма флуоксетина (Прозак) влияет на психическое ...
Как время приёма флуоксетина влияет на психическое здоровье Новое исследование, опубликованное в жур...
Синхронизация мозговой активности при визуальном контакте: с...
Введение С развитием пандемии коронавирусной болезни 2019 онлайн-встречи стали неотъемлемой частью о...
Улучшение когнитивных функций после реваскуляризации сонных ...
Значение атеросклероза сонных артерий Пациенты с атеросклерозом сонных артерий находятся под риском ...
Дети родителей с шизофренией или биполярным расстройством: р...
Дети родителей с шизофренией или биполярным расстройством: риски и защитные факторы Новое долгосроч...
Обработка речи как дискретных сигналов
Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.
Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.
Методы и эксперименты
Стимулы и участники
В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.
Регистрация MEG
Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.
- Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
- Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.
Границы восприятия речи
Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.
«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»
Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.