
Интересное сегодня
Обзор «Открытого Сократа»: Дело о философской жизни
ВведениеМногие знают, что Сократ заявил, что «неисследованная жизнь не стоит жизни». И что он был су...
Понимание разрывов в поддержке между друзьями
Введение Бывало ли у вас так, что вы пережили ужасный день — расстались с кем-то, провалили экзамен ...
Модель поведения: разница между переменными интервалами и пе...
Теоретическая модель поведения Данная статья предлагает теоретическую модель, решающую долго неразре...
Влияние продолжительного сна на когнитивные функции при депр...
Краткое описание исследования Недавнее исследование, проведенное учеными из Университета Техаса в Са...
Супервизия как импровизация: Новый подход к профессиональном...
Введение в концепцию импровизации Понятие импровизации часто ассоциируется с чем-то недостаточным и ...
Может ли ИИ создавать мемы? Новое исследование сравнивает юм...
Способен ли искусственный интеллект (ИИ) понять юмор? Новое исследование показывает, что ИИ может со...
Обработка речи как дискретных сигналов
Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.
Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.
Методы и эксперименты
Стимулы и участники
В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.
Регистрация MEG
Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.
- Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
- Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.
Границы восприятия речи
Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.
«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»
Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.