Раскрытие молчания: использование данных о социальных взаимодействиях для выявления пользователей с высоким риском суицида в интернете с помощью анализа сетей и машинного обучения

Раскрытие молчания: использование данных о социальных взаимодействиях для выявления пользователей с высоким риском суицида в интернете с помощью анализа сетей и машинного обучения

Интересное сегодня

Как платформенное лидерство стимулирует инновационное поведе...

Роль инновационного поведения в работе медсестерИнновационное поведение — это способность сотруднико...

Как негативно воспринимать окружающий мир: особенности чувст...

Введение Вы находитесь в восьмом классе. Это урок математики, и вы пытаетесь закончить задание по ге...

Распознавание лиц и восприятие расы: исследование просопагно...

Введение Информация, связанная с расой, быстро извлекается из лиц и может значительно влиять на межл...

Общности и вариации в представлении эмоций через модальности...

Исследование эмоций через различные модальности Люди выражают эмоции через различные модальности, та...

Брак: странные и неожиданные факты

Брак — это странное явление. Два полностью независимых человека встречаются, влюбляются и договарива...

Как принимать решения: интуиция или анализ?

Как мы принимаем решения каждый деньПовседневные решения влияют на все аспекты нашей жизни — от выбо...

figure 1
figure 1
figure 2
figure 2
Thumbnail 1
Thumbnail 2
Thumbnail 3
Thumbnail 4
Thumbnail 5
Оригинал исследования на сайте автора

Суицидальные мысли и поведение (СМП) сильно стигматизированы и являются табу. Несмотря на цензуру, они широко распространены в интернете, и их обнаружение может быть улучшено за счет разработки уникально полезных цифровых маркеров. В данном исследовании мы сосредоточились на форуме "Sanctioned Suicide", где обсуждаются темы суицида без цензуры. Мы выявили 17 эгоцентрических сетевых характеристик, чтобы захватить динамику социальных взаимодействий и вовлеченности в этом уникальном сообществе. Используя сетевые данные, полученные из более чем 3,2 миллиона уникальных взаимодействий 192 человек, 48 из которых были определены как пользователи с высоким риском (ВРП), мы обучили, проверили и протестировали модель классификации машинного обучения для прогнозирования статуса ВРП.

Методы

Исследование использовало данные с форума "Sanctioned Suicide", где пользователи могут анонимно обсуждать темы суицида. Были собраны данные о более чем 600,000 постах в 40,000 треддах и 11,000 пользователей. Данные были анонимизированы и обработаны для выделения сетевых характеристик.

Сбор данных

Данные были собраны с помощью скрипта на Python, который использовал библиотеку BeautifulSoup для парсинга HTML и XML информации сайта. Были собраны данные о заголовках тредов, авторах, датах постов, тексте постов и упоминаниях других пользователей.

Предобработка данных

Была разработана структурированная методика для выборки когорты и маркировки исходов. Пользователи с высоким риском были определены на основе постов о попытках суицида. Были выделены 48 ВРП и 144 контрольных пользователя.

Квантификация активности форума на основе сетей

Была разработана схема квантификации активности форума, основанная на взаимодействиях в тредах. Были построены сети взаимодействий и выделены эгоцентрические сети для каждого пользователя.

Выделение сетевых структурных характеристик

Были вычислены 17 сетевых характеристик, включая плотность, транзитивность, центральность входной и выходной степени. Эти характеристики были использованы для обучения модели машинного обучения.

Моделирование и интроспекция машинного обучения

Использовалась модель логистической регрессии с эластичной сетью для прогнозирования статуса ВРП. Модель была оценена с помощью метрик чувствительности, специфичности, F1-скора и AUC. Были использованы методы SHAP для анализа влияния характеристик на прогнозы модели.

Результаты

Модель машинного обучения достигла AUC=0.73, что указывает на значительную способность прогнозировать ВРП на основе сетевых характеристик социальных взаимодействий. Наиболее важными характеристиками были транзитивность, плотность и центральность входной степени. Модель также показала, что ВРП чаще являются целями социальных обменов с меньшей частотой и имеют эгоцентрические сети с "малым миром" свойствами.

Исследование подчеркивает важность сетевых характеристик в прогнозировании суицидального риска и предлагает интеграцию этих характеристик в будущие исследования СМП.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода