Интересное сегодня
Изучение категорий речевого восприятия: как индивидуальные р...
Введение Слушатели должны классифицировать входную речь по категориям, таким как /d/ и /t/, чтобы то...
Метод распознавания именованных сущностей в психомедицине на...
Основные аспекты метода распознавания именованных сущностей (NER) Распознавание именованных сущносте...
Гены психических заболеваний влияют на мозг уже в утробе мат...
Когда гены, связанные с психическими заболеваниями, начинают влиять на мозг? Многие гены, ассоцииров...
Невербальная обучающая инвалидность (NVLD): распространеннос...
Введение Термин Невербальная обучающая инвалидность (NVLD) был впервые введен Джонсоном и Миклебасто...
Когнитивные стратегии и затраты на переключение: исследовани...
Введение Переключение между задачами обычно связано с затратами по сравнению с повторением одной и т...
Добровольное целибатство: статистика, причины и удовлетворён...
Сколько мужчин и женщин выбирают целибат? В прошлом году Kinsey Institute (Институт Кинси) провёл на...
Введение
Конкретность — это степень, в которой понятие, обозначаемое словом, относится к воспринимаемому объекту. Эта переменная впервые стала значимой в психологии благодаря теории двойного кодирования Пайвио. Согласно этой теории, человеческое познание оперирует двумя типами ментальных репрезентаций: (1) вербальными, кодирующими лингвистические закономерности, и (2) ментальными образами, фиксирующими перцептивный опыт.
Теоретическая база
Современные исследования показывают, что оба типа репрезентаций взаимодействуют, но акцент может смещаться в сторону лингвистических паттернов или контекстуального опыта. Нейробиологические и поведенческие работы продолжают изучать механизмы концептуальной обработки, где оценки конкретности играют ключевую роль.
Проблемы существующих методов
Традиционные корпуса оценок конкретности (например, Brysbaert et al.) имеют три ограничения:
- Ограниченный охват слов: 40,000 английских слов — менее четверти Оксфордского словаря.
- Ресурсоемкость: Требуют тысяч часов ручного труда (17,000 часов для Brysbaert et al.).
- Отсутствие контекста: Слова оцениваются изолированно, хотя их значение зависит от употребления.
Недостатки текущих решений
Автоматизированные методы (например, на основе word embeddings или «selectional preference») демонстрируют корреляцию с человеческими оценками не выше 0.72. Они плохо работают с абстрактными понятиями и мультиязычными контекстами.
Наш подход
Мы предлагаем метод, объединяющий четыре компонента:
- Контекстные эмбеддинги на основе трансформеров.
- Мультимодальное обучение (текст + изображения).
- Эмоциональная адаптация через дообучение на аффективных данных.
- Кросс-лингвистическая генерация оценок.
Архитектура модели
Основу составляет мультимодальная модель CLIP (Contrastive Language–Image Pretraining), дообученная на датасете из 85,007 изображений с эмоциональными метками. Глубокий регрессор комбинирует визуальные и эмоциональные эмбеддинги для предсказания конкретности.
Результаты
Метод достиг следующих показателей:
- Английские слова: r=0.93.
- Многословные выражения: r=0.85.
- Эстонский язык: r=0.68–0.80 (после постобработки).
Кросс-лингвистическая адаптация
Несмотря на различия в распределении оценок между английским (бимодальное) и эстонским (равномерное), модель успешно обобщила закономерности, подтверждая универсальность подхода.
Применение
Метод полезен для:
- Когнитивных исследований: Контроль стимулов в экспериментах по семантической памяти.
- Психолингвистики: Изучение усвоения языка и нейронных коррелятов абстракций.
- NLP: Улучшение метафор-детекции, машинного перевода и упрощения текстов.
Ограничения
1. Культурные смещения в тренировочных данных CLIP.
2. Сложности с промежуточными понятиями (3–4 балла по шкале конкретности).
3. Ограниченная проверка на языках вне индоевропейской семьи.
Перспективы
Будущие работы должны интегрировать многоязычные модели (mBERT, XLM-R) для прямого анализа без перевода.