
Интересное сегодня
Переосмысление одиночества: счастливая жизнь без романтическ...
Введение На протяжении большей части прошлого века социальные учёные интересовались браком, а не оди...
Влияние ночных смен на когнитивные функции и мозговое кровоо...
Влияние ночных смен на когнитивные функции и мозговое кровообращение Работа в ночные смены является ...
Как программы домашнего визитирования помогают семьям с мате...
Введение Программы домашней поддержки семей предоставляют раннее вмешательство для предотвращения же...
Убийства-самоубийства в США: статистика, жертвы и меры профи...
Основные факты об убийствах-самоубийствах в США Новое исследование Колумбийского университета (Colum...
Использование соотношения нейтрофилов к лимфоцитам как биома...
Обзор расстройств пищевого поведения Расстройства пищевого поведения (РПП) представляют собой психиа...
Как превратить бесполезное размышление в продуктивное: страт...
Продуктивное и бесполезное размышление – как брат и сестра. Между ними лишь небольшие различия, одна...
Введение
Конкретность — это степень, в которой понятие, обозначаемое словом, относится к воспринимаемому объекту. Эта переменная впервые стала значимой в психологии благодаря теории двойного кодирования Пайвио. Согласно этой теории, человеческое познание оперирует двумя типами ментальных репрезентаций: (1) вербальными, кодирующими лингвистические закономерности, и (2) ментальными образами, фиксирующими перцептивный опыт.
Теоретическая база
Современные исследования показывают, что оба типа репрезентаций взаимодействуют, но акцент может смещаться в сторону лингвистических паттернов или контекстуального опыта. Нейробиологические и поведенческие работы продолжают изучать механизмы концептуальной обработки, где оценки конкретности играют ключевую роль.
Проблемы существующих методов
Традиционные корпуса оценок конкретности (например, Brysbaert et al.) имеют три ограничения:
- Ограниченный охват слов: 40,000 английских слов — менее четверти Оксфордского словаря.
- Ресурсоемкость: Требуют тысяч часов ручного труда (17,000 часов для Brysbaert et al.).
- Отсутствие контекста: Слова оцениваются изолированно, хотя их значение зависит от употребления.
Недостатки текущих решений
Автоматизированные методы (например, на основе word embeddings или «selectional preference») демонстрируют корреляцию с человеческими оценками не выше 0.72. Они плохо работают с абстрактными понятиями и мультиязычными контекстами.
Наш подход
Мы предлагаем метод, объединяющий четыре компонента:
- Контекстные эмбеддинги на основе трансформеров.
- Мультимодальное обучение (текст + изображения).
- Эмоциональная адаптация через дообучение на аффективных данных.
- Кросс-лингвистическая генерация оценок.
Архитектура модели
Основу составляет мультимодальная модель CLIP (Contrastive Language–Image Pretraining), дообученная на датасете из 85,007 изображений с эмоциональными метками. Глубокий регрессор комбинирует визуальные и эмоциональные эмбеддинги для предсказания конкретности.
Результаты
Метод достиг следующих показателей:
- Английские слова: r=0.93.
- Многословные выражения: r=0.85.
- Эстонский язык: r=0.68–0.80 (после постобработки).
Кросс-лингвистическая адаптация
Несмотря на различия в распределении оценок между английским (бимодальное) и эстонским (равномерное), модель успешно обобщила закономерности, подтверждая универсальность подхода.
Применение
Метод полезен для:
- Когнитивных исследований: Контроль стимулов в экспериментах по семантической памяти.
- Психолингвистики: Изучение усвоения языка и нейронных коррелятов абстракций.
- NLP: Улучшение метафор-детекции, машинного перевода и упрощения текстов.
Ограничения
1. Культурные смещения в тренировочных данных CLIP.
2. Сложности с промежуточными понятиями (3–4 балла по шкале конкретности).
3. Ограниченная проверка на языках вне индоевропейской семьи.
Перспективы
Будущие работы должны интегрировать многоязычные модели (mBERT, XLM-R) для прямого анализа без перевода.