Интересное сегодня
Как ожидание получения предмета влияет на тактильное восприя...
Тактильная фасилитация при ожидании и фактическом получении объекта Введение Во время движений, свя...
Дефицит спонтанного и вызванного стимулом извлечения как ран...
Дефицит спонтанного и вызванного стимулом извлечения как ранний признак аномального старения Введен...
Как восприятие двойственных чувств партнёра влияет на ваше б...
Как восприятие двойственных чувств партнёра влияет на ваше благополучие Неуверенность в чувствах па...
Преодоление психологических барьеров и принятие здорового об...
Введение Жизнь с хроническими заболеваниями, такими как диабет (DM) или инсулиновая резистентность (...
Музыкальная терапия как лечение хронической боли
Введение Хроническая боль (ХБ) была определена Международной ассоциацией по исследованию боли как ус...
Как слоны общаются в игре: исследование мимикрии и эмпатии
Игровое поведение: баланс между сотрудничеством и конкуренцией Игра у животных часто сочетает элемен...
Введение
Конкретность — это степень, в которой понятие, обозначаемое словом, относится к воспринимаемому объекту. Эта переменная впервые стала значимой в психологии благодаря теории двойного кодирования Пайвио. Согласно этой теории, человеческое познание оперирует двумя типами ментальных репрезентаций: (1) вербальными, кодирующими лингвистические закономерности, и (2) ментальными образами, фиксирующими перцептивный опыт.
Теоретическая база
Современные исследования показывают, что оба типа репрезентаций взаимодействуют, но акцент может смещаться в сторону лингвистических паттернов или контекстуального опыта. Нейробиологические и поведенческие работы продолжают изучать механизмы концептуальной обработки, где оценки конкретности играют ключевую роль.
Проблемы существующих методов
Традиционные корпуса оценок конкретности (например, Brysbaert et al.) имеют три ограничения:
- Ограниченный охват слов: 40,000 английских слов — менее четверти Оксфордского словаря.
- Ресурсоемкость: Требуют тысяч часов ручного труда (17,000 часов для Brysbaert et al.).
- Отсутствие контекста: Слова оцениваются изолированно, хотя их значение зависит от употребления.
Недостатки текущих решений
Автоматизированные методы (например, на основе word embeddings или «selectional preference») демонстрируют корреляцию с человеческими оценками не выше 0.72. Они плохо работают с абстрактными понятиями и мультиязычными контекстами.
Наш подход
Мы предлагаем метод, объединяющий четыре компонента:
- Контекстные эмбеддинги на основе трансформеров.
- Мультимодальное обучение (текст + изображения).
- Эмоциональная адаптация через дообучение на аффективных данных.
- Кросс-лингвистическая генерация оценок.
Архитектура модели
Основу составляет мультимодальная модель CLIP (Contrastive Language–Image Pretraining), дообученная на датасете из 85,007 изображений с эмоциональными метками. Глубокий регрессор комбинирует визуальные и эмоциональные эмбеддинги для предсказания конкретности.
Результаты
Метод достиг следующих показателей:
- Английские слова: r=0.93.
- Многословные выражения: r=0.85.
- Эстонский язык: r=0.68–0.80 (после постобработки).
Кросс-лингвистическая адаптация
Несмотря на различия в распределении оценок между английским (бимодальное) и эстонским (равномерное), модель успешно обобщила закономерности, подтверждая универсальность подхода.
Применение
Метод полезен для:
- Когнитивных исследований: Контроль стимулов в экспериментах по семантической памяти.
- Психолингвистики: Изучение усвоения языка и нейронных коррелятов абстракций.
- NLP: Улучшение метафор-детекции, машинного перевода и упрощения текстов.
Ограничения
1. Культурные смещения в тренировочных данных CLIP.
2. Сложности с промежуточными понятиями (3–4 балла по шкале конкретности).
3. Ограниченная проверка на языках вне индоевропейской семьи.
Перспективы
Будущие работы должны интегрировать многоязычные модели (mBERT, XLM-R) для прямого анализа без перевода.