Интересное сегодня
Предпочтения возрастного разрыва в романтических отношениях
ВведениеМногие люди выбирают партнеров примерно своего возраста, но некоторые предпочитают партнеров...
Восприятие лиц: как мы читаем эмоции и понимаем друг друга |...
Введение в восприятие лиц Лица занимают центральное место в социальной жизни человека и представляют...
Может ли ИИ создавать мемы? Новое исследование сравнивает юм...
Способен ли искусственный интеллект (ИИ) понять юмор? Новое исследование показывает, что ИИ может со...
Нужды сотрудников: ключевые факторы благополучия и эффективн...
Введение Стремление к насыщенной профессиональной жизни привело ученых к глубокому изучению факторов...
Использование методов ИИ для выявления риска депрессии среди...
Введение Проблема психического здоровья аспирантов становится все более актуальной. Исследования пок...
Как нарцисс реагирует, когда теряет контроль над вами?
Как нарцисс реагирует, когда теряет контроль? Нарциссы не просто стремятся к контролю — они считают,...
Обработка речи как дискретных сигналов
Человеческий мозг воспринимает непрерывную речь как последовательность отдельных элементов. Чтобы понять механизмы этого процесса, важно определить временное окно сегментации — интервал, за который мозг обрабатывает речевую информацию. Методы с высокой временной разрешающей способностью, такие как магнитоэнцефалография (МЭГ) и электроэнцефалография (ЭЭГ), идеально подходят для таких исследований.
Предыдущие работы показали, что единицы обработки речи (например, слоги) имеют длительность от 10 до 1000 мс. Однако точные временные границы восприятия оставались неясными. В данном исследовании использовались синтезированные японские слова /atataka/ с варьируемой скоростью (75–600 мс) для выявления корреляции между слуховыми вызванными магнитными полями (AEFs) и восприятием слогов.
Методы и эксперименты
Стимулы и участники
В исследовании участвовали 15 здоровых носителей японского языка с нормальным слухом. Синтезированные слова /atataka/ (означающие «теплый») генерировались с восемью разными скоростями (75–600 мс) при сохранении фонетической структуры. Акустические параметры, включая длительность и спектральные переходы, строго контролировались.
Регистрация MEG
Магнитоэнцефалография (МЭГ) фиксировала активность слуховой коры в ответ на стимулы. Участники слушали звуки в магнитозащищенной комнате, одновременно наблюдая за немым фильмом, чтобы минимизировать влияние внимания. Анализировались компоненты M100 (аналог N100 в ЭЭГ), возникающие через ~100 мс после начала стимула.
- Ключевые параметры: длительность стимула, количество воспринятых слогов, латентность и амплитуда M100.
- Статистика: корреляционный анализ и дискриминантное тестирование локализации диполей.
Границы восприятия речи
Результаты выявили четкую корреляцию между количеством компонентов M100 и воспринятых слогов. При длительности слов 375–600 мс наблюдались четыре ответа M100, соответствующих каждому слогу. Критическое временное окно сегментации составило 75–94 мс — это минимальный интервал, необходимый для распознавания слога.
«Слоги являются функциональными единицами восприятия речи, а M100 отражает их дискретную обработку в слуховой коре»
Исследование также показало, что первые слоги активируют более латеральные участки верхней височной извилины (извилина Гешля), чем последующие. Это может быть связано с реакцией на новизну. Полученные данные помогут оптимизировать синтезированную речь для систем с высокой скоростью воспроизведения.