Интересное сегодня
Психосоциальное воздействие рака: позитивные и негативные по...
Введение в психосоциальное воздействие рака С развитием методов лечения рака многие виды онкологичес...
Ответственное использование нулевых выстрелов ИИ для оценки ...
Введение Искусственный интеллект (ИИ) имеет огромный потенциал для облегчения процесса оценки и улуч...
Номофобия среди студентов-медсестер: распространенность и св...
Введение Исследование номофобии, или страха остаться без мобильного телефона, показывает, что этот ф...
Как принятие болезни и вера в себя снижают одиночество у пож...
Влияние социальной изоляции на одиночество у пациентов с болезнью Паркинсона В данном исследовании и...
Анализ симптомов тревоги у пациентов с хронической обструкти...
Введение Целью данного исследования является изучение классов симптомов тревоги у пациентов, страдаю...
Динамическая коррекция времени (DTW) в терапии расстройств п...
Введение В психологических и психиатрических исследованиях, а также в клинической практике доминиру...
Обработка речи как дискретных сигналов
Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.
Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.
Методы и эксперименты
Стимулы и участники
В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.
Регистрация MEG
Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.
- Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
- Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.
Границы восприятия речи
Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.
«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»
Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.