Автоматическая оценка конкретности слов: новый подход в когнитивной науке и NLP

Автоматическая оценка конкретности слов: новый подход в когнитивной науке и NLP

Интересное сегодня

Как ожидание получения предмета влияет на тактильное восприя...

Тактильная фасилитация при ожидании и фактическом получении объекта Введение Во время движений, свя...

Дефицит спонтанного и вызванного стимулом извлечения как ран...

Дефицит спонтанного и вызванного стимулом извлечения как ранний признак аномального старения Введен...

Как восприятие двойственных чувств партнёра влияет на ваше б...

Как восприятие двойственных чувств партнёра влияет на ваше благополучие Неуверенность в чувствах па...

Преодоление психологических барьеров и принятие здорового об...

Введение Жизнь с хроническими заболеваниями, такими как диабет (DM) или инсулиновая резистентность (...

Музыкальная терапия как лечение хронической боли

Введение Хроническая боль (ХБ) была определена Международной ассоциацией по исследованию боли как ус...

Как слоны общаются в игре: исследование мимикрии и эмпатии

Игровое поведение: баланс между сотрудничеством и конкуренцией Игра у животных часто сочетает элемен...

Рисунок 1: Архитектура системы для генерации оценок конкретности
Рисунок 1: Архитектура системы для генерации оценок конкретности
Рисунок 2: Распределение оценок конкретности для английских слов
Рисунок 2: Распределение оценок конкретности для английских слов
Рисунок 3: Сравнение предсказанных и истинных оценок
Рисунок 3: Сравнение предсказанных и истинных оценок
Рисунок 4: Распределение для многословных выражений
Рисунок 4: Распределение для многословных выражений
Рисунок 5: Плотность распределения оценок для многословных выражений
Рисунок 5: Плотность распределения оценок для многословных выражений
Рисунок 6: Тепловая карта предсказаний для эстонских выражений
Рисунок 6: Тепловая карта предсказаний для эстонских выражений
Рисунок 7: Сравнение распределений оценок для эстонского языка
Рисунок 7: Сравнение распределений оценок для эстонского языка
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Thumbnail 5
Thumbnail 6
Thumbnail 7
Читать короткую версию
Кликните еще раз для перехода

Введение

Конкретность — это степень, в которой понятие, обозначаемое словом, относится к воспринимаемому объекту. Эта переменная впервые стала значимой в психологии благодаря теории двойного кодирования Пайвио. Согласно этой теории, человеческое познание оперирует двумя типами ментальных репрезентаций: (1) вербальными, кодирующими лингвистические закономерности, и (2) ментальными образами, фиксирующими перцептивный опыт.

Теоретическая база

Современные исследования показывают, что оба типа репрезентаций взаимодействуют, но акцент может смещаться в сторону лингвистических паттернов или контекстуального опыта. Нейробиологические и поведенческие работы продолжают изучать механизмы концептуальной обработки, где оценки конкретности играют ключевую роль.

Проблемы существующих методов

Традиционные корпуса оценок конкретности (например, Brysbaert et al.) имеют три ограничения:

  • Ограниченный охват слов: 40,000 английских слов — менее четверти Оксфордского словаря.
  • Ресурсоемкость: Требуют тысяч часов ручного труда (17,000 часов для Brysbaert et al.).
  • Отсутствие контекста: Слова оцениваются изолированно, хотя их значение зависит от употребления.

Недостатки текущих решений

Автоматизированные методы (например, на основе word embeddings или «selectional preference») демонстрируют корреляцию с человеческими оценками не выше 0.72. Они плохо работают с абстрактными понятиями и мультиязычными контекстами.

Наш подход

Мы предлагаем метод, объединяющий четыре компонента:

  1. Контекстные эмбеддинги на основе трансформеров.
  2. Мультимодальное обучение (текст + изображения).
  3. Эмоциональная адаптация через дообучение на аффективных данных.
  4. Кросс-лингвистическая генерация оценок.

Архитектура модели

Основу составляет мультимодальная модель CLIP (Contrastive Language–Image Pretraining), дообученная на датасете из 85,007 изображений с эмоциональными метками. Глубокий регрессор комбинирует визуальные и эмоциональные эмбеддинги для предсказания конкретности.

Результаты

Метод достиг следующих показателей:

  • Английские слова: r=0.93.
  • Многословные выражения: r=0.85.
  • Эстонский язык: r=0.68–0.80 (после постобработки).

Кросс-лингвистическая адаптация

Несмотря на различия в распределении оценок между английским (бимодальное) и эстонским (равномерное), модель успешно обобщила закономерности, подтверждая универсальность подхода.

Применение

Метод полезен для:

  • Когнитивных исследований: Контроль стимулов в экспериментах по семантической памяти.
  • Психолингвистики: Изучение усвоения языка и нейронных коррелятов абстракций.
  • NLP: Улучшение метафор-детекции, машинного перевода и упрощения текстов.

Ограничения

1. Культурные смещения в тренировочных данных CLIP.
2. Сложности с промежуточными понятиями (3–4 балла по шкале конкретности).
3. Ограниченная проверка на языках вне индоевропейской семьи.

Перспективы

Будущие работы должны интегрировать многоязычные модели (mBERT, XLM-R) для прямого анализа без перевода.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода

Детские мультивитамины Бэби Формула Мишки — укрепление иммун...

Бэби Формула Мишки Мультивитамины — вкусные жевательные пастилки для детей от 3 лет. Обогащают рацио...

Мицеллярная вода Avene Cleanance 400 мл - уход за проблемной...

Мицеллярная вода Avene Cleanance для жирной и проблемной кожи эффективно удаляет макияж и загрязнени...

Купить Сандра таб. подъяз. гомеопат. 250 мг №30 в аптеке

Сандра – гомеопатический препарат комплексного действия. Таблетки подъязычные 250 мг, 30 шт. Не взаи...

Тампоны O.b. Pro Comfort Super Plus №16 - Купить в аптеке

Тампоны O.b. Pro Comfort Super Plus №16 с инновационной технологией спиралевидных желобков обеспечив...

Эваменол мазь от насморка 15 г – быстрое облегчение

Эваменол мазь – эффективное средство для облегчения симптомов острого и хронического ринита. Сочетан...

Тонометр Эй Энд Ди UB-505 автоматический на запястье

Автоматический тонометр на запястье Эй Энд Ди UB-505 — ваш надежный помощник для измерения давления....