
Интересное сегодня
Как платформенное лидерство стимулирует инновационное поведе...
Роль инновационного поведения в работе медсестерИнновационное поведение — это способность сотруднико...
Как негативно воспринимать окружающий мир: особенности чувст...
Введение Вы находитесь в восьмом классе. Это урок математики, и вы пытаетесь закончить задание по ге...
Распознавание лиц и восприятие расы: исследование просопагно...
Введение Информация, связанная с расой, быстро извлекается из лиц и может значительно влиять на межл...
Общности и вариации в представлении эмоций через модальности...
Исследование эмоций через различные модальности Люди выражают эмоции через различные модальности, та...
Брак: странные и неожиданные факты
Брак — это странное явление. Два полностью независимых человека встречаются, влюбляются и договарива...
Как принимать решения: интуиция или анализ?
Как мы принимаем решения каждый деньПовседневные решения влияют на все аспекты нашей жизни — от выбо...
Суицидальные мысли и поведение (СМП) сильно стигматизированы и являются табу. Несмотря на цензуру, они широко распространены в интернете, и их обнаружение может быть улучшено за счет разработки уникально полезных цифровых маркеров. В данном исследовании мы сосредоточились на форуме "Sanctioned Suicide", где обсуждаются темы суицида без цензуры. Мы выявили 17 эгоцентрических сетевых характеристик, чтобы захватить динамику социальных взаимодействий и вовлеченности в этом уникальном сообществе. Используя сетевые данные, полученные из более чем 3,2 миллиона уникальных взаимодействий 192 человек, 48 из которых были определены как пользователи с высоким риском (ВРП), мы обучили, проверили и протестировали модель классификации машинного обучения для прогнозирования статуса ВРП.
Методы
Исследование использовало данные с форума "Sanctioned Suicide", где пользователи могут анонимно обсуждать темы суицида. Были собраны данные о более чем 600,000 постах в 40,000 треддах и 11,000 пользователей. Данные были анонимизированы и обработаны для выделения сетевых характеристик.
Сбор данных
Данные были собраны с помощью скрипта на Python, который использовал библиотеку BeautifulSoup для парсинга HTML и XML информации сайта. Были собраны данные о заголовках тредов, авторах, датах постов, тексте постов и упоминаниях других пользователей.
Предобработка данных
Была разработана структурированная методика для выборки когорты и маркировки исходов. Пользователи с высоким риском были определены на основе постов о попытках суицида. Были выделены 48 ВРП и 144 контрольных пользователя.
Квантификация активности форума на основе сетей
Была разработана схема квантификации активности форума, основанная на взаимодействиях в тредах. Были построены сети взаимодействий и выделены эгоцентрические сети для каждого пользователя.
Выделение сетевых структурных характеристик
Были вычислены 17 сетевых характеристик, включая плотность, транзитивность, центральность входной и выходной степени. Эти характеристики были использованы для обучения модели машинного обучения.
Моделирование и интроспекция машинного обучения
Использовалась модель логистической регрессии с эластичной сетью для прогнозирования статуса ВРП. Модель была оценена с помощью метрик чувствительности, специфичности, F1-скора и AUC. Были использованы методы SHAP для анализа влияния характеристик на прогнозы модели.
Результаты
Модель машинного обучения достигла AUC=0.73, что указывает на значительную способность прогнозировать ВРП на основе сетевых характеристик социальных взаимодействий. Наиболее важными характеристиками были транзитивность, плотность и центральность входной степени. Модель также показала, что ВРП чаще являются целями социальных обменов с меньшей частотой и имеют эгоцентрические сети с "малым миром" свойствами.
Исследование подчеркивает важность сетевых характеристик в прогнозировании суицидального риска и предлагает интеграцию этих характеристик в будущие исследования СМП.