
Интересное сегодня
Как ощущается паническая атака: симптомы и способы справитьс...
Что такое паническая атака? Паническая атака — это внезапный приступ сильного страха или тревоги, ко...
Влияние лекарств от биполярного расстройства на микробиом ки...
Новое исследование, опубликованное в Microbiology, является первым систематическим обзором потенциал...
Влияние погодных условий на использование социальных сетей
Введение В современном мире социальные сети стали важной частью нашей жизни. Тем не менее, все больш...
Как когнитивные искажения влияют на политическую поляризацию...
Поляризация и когнитивные искажения в современной политикеПсихологические исследования фиксируют тре...
Игра в стереоскопические видеоигры улучшает точность, но не ...
Введение Исследования показывают, что игра в видеоигры улучшает широкий спектр зрительных и когнитив...
Как полюбить своё тело: советы от экспертов и личный опыт
Моя история: от ненависти к телу к принятию Вот что я никогда никому не говорила: я ношу 48-й размер...
Суицидальные мысли и поведение (СМП) сильно стигматизированы и являются табу. Несмотря на цензуру, они широко распространены в интернете, и их обнаружение может быть улучшено за счет разработки уникально полезных цифровых маркеров. В данном исследовании мы сосредоточились на форуме "Sanctioned Suicide", где обсуждаются темы суицида без цензуры. Мы выявили 17 эгоцентрических сетевых характеристик, чтобы захватить динамику социальных взаимодействий и вовлеченности в этом уникальном сообществе. Используя сетевые данные, полученные из более чем 3,2 миллиона уникальных взаимодействий 192 человек, 48 из которых были определены как пользователи с высоким риском (ВРП), мы обучили, проверили и протестировали модель классификации машинного обучения для прогнозирования статуса ВРП.
Методы
Исследование использовало данные с форума "Sanctioned Suicide", где пользователи могут анонимно обсуждать темы суицида. Были собраны данные о более чем 600,000 постах в 40,000 треддах и 11,000 пользователей. Данные были анонимизированы и обработаны для выделения сетевых характеристик.
Сбор данных
Данные были собраны с помощью скрипта на Python, который использовал библиотеку BeautifulSoup для парсинга HTML и XML информации сайта. Были собраны данные о заголовках тредов, авторах, датах постов, тексте постов и упоминаниях других пользователей.
Предобработка данных
Была разработана структурированная методика для выборки когорты и маркировки исходов. Пользователи с высоким риском были определены на основе постов о попытках суицида. Были выделены 48 ВРП и 144 контрольных пользователя.
Квантификация активности форума на основе сетей
Была разработана схема квантификации активности форума, основанная на взаимодействиях в тредах. Были построены сети взаимодействий и выделены эгоцентрические сети для каждого пользователя.
Выделение сетевых структурных характеристик
Были вычислены 17 сетевых характеристик, включая плотность, транзитивность, центральность входной и выходной степени. Эти характеристики были использованы для обучения модели машинного обучения.
Моделирование и интроспекция машинного обучения
Использовалась модель логистической регрессии с эластичной сетью для прогнозирования статуса ВРП. Модель была оценена с помощью метрик чувствительности, специфичности, F1-скора и AUC. Были использованы методы SHAP для анализа влияния характеристик на прогнозы модели.
Результаты
Модель машинного обучения достигла AUC=0.73, что указывает на значительную способность прогнозировать ВРП на основе сетевых характеристик социальных взаимодействий. Наиболее важными характеристиками были транзитивность, плотность и центральность входной степени. Модель также показала, что ВРП чаще являются целями социальных обменов с меньшей частотой и имеют эгоцентрические сети с "малым миром" свойствами.
Исследование подчеркивает важность сетевых характеристик в прогнозировании суицидального риска и предлагает интеграцию этих характеристик в будущие исследования СМП.