Как мозг обрабатывает речь: временные окна восприятия звуков

Интересное сегодня

Психосоциальное воздействие рака: позитивные и негативные по...

Введение в психосоциальное воздействие рака С развитием методов лечения рака многие виды онкологичес...

Ответственное использование нулевых выстрелов ИИ для оценки ...

Введение Искусственный интеллект (ИИ) имеет огромный потенциал для облегчения процесса оценки и улуч...

Номофобия среди студентов-медсестер: распространенность и св...

Введение Исследование номофобии, или страха остаться без мобильного телефона, показывает, что этот ф...

Как принятие болезни и вера в себя снижают одиночество у пож...

Влияние социальной изоляции на одиночество у пациентов с болезнью Паркинсона В данном исследовании и...

Анализ симптомов тревоги у пациентов с хронической обструкти...

Введение Целью данного исследования является изучение классов симптомов тревоги у пациентов, страдаю...

Динамическая коррекция времени (DTW) в терапии расстройств п...

Введение В психологических и психиатрических исследованиях, а также в клинической практике доминиру...

figure 1

figure 2

figure 3

figure 4

figure 5

figure 6

figure 7

Оригинал исследования на сайте автора

Обработка речи как дискретных сигналов

Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.

Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.

Методы и эксперименты

Стимулы и участники

В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.

Регистрация MEG

Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.

Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.

Границы восприятия речи

Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.

«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»

Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.

Короткие версии статей можно найти в телеграм-канале.

Как мозг обрабатывает речь: временные окна восприятия звуков

Интересное сегодня

Психосоциальное воздействие рака: позитивные и негативные по...

Ответственное использование нулевых выстрелов ИИ для оценки ...

Номофобия среди студентов-медсестер: распространенность и св...

Как принятие болезни и вера в себя снижают одиночество у пож...

Анализ симптомов тревоги у пациентов с хронической обструкти...

Динамическая коррекция времени (DTW) в терапии расстройств п...

Обработка речи как дискретных сигналов

Методы и эксперименты

Стимулы и участники

Регистрация MEG

Границы восприятия речи

Теги:

Крем Урьяж Ксемоз Липидовосстанавливающий 200Мл

Турбослим Кофе для похудения - снижение аппетита, 10 саше

Крем Dr.Sebagh Absolute Extreme для ухода за сухой кожей

Мастопол №60 — гомеопатические подъязычные таблетки

Компрессионные колготки для беременных 70Den — размер 5

Авен Сан Крем SPF50+ антивозрастной 50 мл