Автоматическая оценка конкретности слов: новый подход в когнитивной науке и NLP

Автоматическая оценка конкретности слов: новый подход в когнитивной науке и NLP

Интересное сегодня

Переосмысление одиночества: счастливая жизнь без романтическ...

Введение На протяжении большей части прошлого века социальные учёные интересовались браком, а не оди...

Влияние ночных смен на когнитивные функции и мозговое кровоо...

Влияние ночных смен на когнитивные функции и мозговое кровообращение Работа в ночные смены является ...

Как программы домашнего визитирования помогают семьям с мате...

Введение Программы домашней поддержки семей предоставляют раннее вмешательство для предотвращения же...

Убийства-самоубийства в США: статистика, жертвы и меры профи...

Основные факты об убийствах-самоубийствах в США Новое исследование Колумбийского университета (Colum...

Использование соотношения нейтрофилов к лимфоцитам как биома...

Обзор расстройств пищевого поведения Расстройства пищевого поведения (РПП) представляют собой психиа...

Как превратить бесполезное размышление в продуктивное: страт...

Продуктивное и бесполезное размышление – как брат и сестра. Между ними лишь небольшие различия, одна...

Рисунок 1: Архитектура системы для генерации оценок конкретности
Рисунок 1: Архитектура системы для генерации оценок конкретности
Рисунок 2: Распределение оценок конкретности для английских слов
Рисунок 2: Распределение оценок конкретности для английских слов
Рисунок 3: Сравнение предсказанных и истинных оценок
Рисунок 3: Сравнение предсказанных и истинных оценок
Рисунок 4: Распределение для многословных выражений
Рисунок 4: Распределение для многословных выражений
Рисунок 5: Плотность распределения оценок для многословных выражений
Рисунок 5: Плотность распределения оценок для многословных выражений
Рисунок 6: Тепловая карта предсказаний для эстонских выражений
Рисунок 6: Тепловая карта предсказаний для эстонских выражений
Рисунок 7: Сравнение распределений оценок для эстонского языка
Рисунок 7: Сравнение распределений оценок для эстонского языка
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Thumbnail 5
Thumbnail 6
Thumbnail 7
Оригинал исследования на сайте автора
Читать короткую версию
Кликните еще раз для перехода

Введение

Конкретность — это степень, в которой понятие, обозначаемое словом, относится к воспринимаемому объекту. Эта переменная впервые стала значимой в психологии благодаря теории двойного кодирования Пайвио. Согласно этой теории, человеческое познание оперирует двумя типами ментальных репрезентаций: (1) вербальными, кодирующими лингвистические закономерности, и (2) ментальными образами, фиксирующими перцептивный опыт.

Теоретическая база

Современные исследования показывают, что оба типа репрезентаций взаимодействуют, но акцент может смещаться в сторону лингвистических паттернов или контекстуального опыта. Нейробиологические и поведенческие работы продолжают изучать механизмы концептуальной обработки, где оценки конкретности играют ключевую роль.

Проблемы существующих методов

Традиционные корпуса оценок конкретности (например, Brysbaert et al.) имеют три ограничения:

  • Ограниченный охват слов: 40,000 английских слов — менее четверти Оксфордского словаря.
  • Ресурсоемкость: Требуют тысяч часов ручного труда (17,000 часов для Brysbaert et al.).
  • Отсутствие контекста: Слова оцениваются изолированно, хотя их значение зависит от употребления.

Недостатки текущих решений

Автоматизированные методы (например, на основе word embeddings или «selectional preference») демонстрируют корреляцию с человеческими оценками не выше 0.72. Они плохо работают с абстрактными понятиями и мультиязычными контекстами.

Наш подход

Мы предлагаем метод, объединяющий четыре компонента:

  1. Контекстные эмбеддинги на основе трансформеров.
  2. Мультимодальное обучение (текст + изображения).
  3. Эмоциональная адаптация через дообучение на аффективных данных.
  4. Кросс-лингвистическая генерация оценок.

Архитектура модели

Основу составляет мультимодальная модель CLIP (Contrastive Language–Image Pretraining), дообученная на датасете из 85,007 изображений с эмоциональными метками. Глубокий регрессор комбинирует визуальные и эмоциональные эмбеддинги для предсказания конкретности.

Результаты

Метод достиг следующих показателей:

  • Английские слова: r=0.93.
  • Многословные выражения: r=0.85.
  • Эстонский язык: r=0.68–0.80 (после постобработки).

Кросс-лингвистическая адаптация

Несмотря на различия в распределении оценок между английским (бимодальное) и эстонским (равномерное), модель успешно обобщила закономерности, подтверждая универсальность подхода.

Применение

Метод полезен для:

  • Когнитивных исследований: Контроль стимулов в экспериментах по семантической памяти.
  • Психолингвистики: Изучение усвоения языка и нейронных коррелятов абстракций.
  • NLP: Улучшение метафор-детекции, машинного перевода и упрощения текстов.

Ограничения

1. Культурные смещения в тренировочных данных CLIP.
2. Сложности с промежуточными понятиями (3–4 балла по шкале конкретности).
3. Ограниченная проверка на языках вне индоевропейской семьи.

Перспективы

Будущие работы должны интегрировать многоязычные модели (mBERT, XLM-R) для прямого анализа без перевода.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода

Траумель С Мазь 50г — гомеопатическое средство от боли

Мазь Траумель С — эффективное гомеопатическое средство для наружного применения, предназначенное для...

Пиобактериофаг Поливалентный Очищенный 20 мл - купить в апте...

Пиобактериофаг Поливалентный Очищенный Жидкий эффективно борется с бактериальными инфекциями, вызыва...

Колготки компрессионные Relaxsan BASIC 140 den против варико...

Компрессионные колготки Relaxsan BASIC 140 den с давлением 18-22 мм рт. ст. обеспечивают надежную по...

Селен-Актив Таблетки №60 – источник селена и витамина С

Селен-Актив – биологически активная добавка с селеном и витамином С для поддержания иммунитета и ант...

Купить Acuvue 1-Day Moist линзы однодневные -6.50

Однодневные контактные линзы Acuvue 1-Day Moist с технологией LACREON® обеспечивают максимальный ком...

Термальная вода Avène 50 мл — уход за чувствительной кожей

Термальная вода Avène 50 мл — незаменимое средство для чувствительной и раздраженной кожи. Успокаива...