Интересное сегодня
Влияние стоимости саккад и значимости на выбор саккад
Стоимость саккад и их влияние на выборЛюди и другие животные с фовеальным зрением совершают резкие д...
Связь между леворукостью и нейроразвитыми расстройствами
Введение Недавний мета-анализ подчеркивает сильную связь между нейроразвитыми расстройствами с языко...
Временная Прикладная Психология: Как Собственность Времени У...
Введение В условиях современного общества, ориентированного на производительность, умение находить в...
Связь префронтальной гипоактивации при стрессе с руминацией,...
Введение в проблему руминации и префронтальной активности Руминация изначально определялась как когн...
Эффективность реформер-пилатеса при хронической боли: исслед...
Введение Мышечно-скелетные нарушения представляют собой глобальную проблему здравоохранения, вызываю...
Как восприятие тела влияет на способность понимать других: р...
Введение Восприятие мира с нашей точки зрения первого лица неизбежно основано на нашем теле, но что ...
Суицидальные мысли и поведение (СМП) сильно стигматизированы и являются табу. Несмотря на цензуру, они широко распространены в интернете, и их обнаружение может быть улучшено за счет разработки уникально полезных цифровых маркеров. В данном исследовании мы сосредоточились на форуме "Sanctioned Suicide", где обсуждаются темы суицида без цензуры. Мы выявили 17 эгоцентрических сетевых характеристик, чтобы захватить динамику социальных взаимодействий и вовлеченности в этом уникальном сообществе. Используя сетевые данные, полученные из более чем 3,2 миллиона уникальных взаимодействий 192 человек, 48 из которых были определены как пользователи с высоким риском (ВРП), мы обучили, проверили и протестировали модель классификации машинного обучения для прогнозирования статуса ВРП.
Методы
Исследование использовало данные с форума "Sanctioned Suicide", где пользователи могут анонимно обсуждать темы суицида. Были собраны данные о более чем 600,000 постах в 40,000 треддах и 11,000 пользователей. Данные были анонимизированы и обработаны для выделения сетевых характеристик.
Сбор данных
Данные были собраны с помощью скрипта на Python, который использовал библиотеку BeautifulSoup для парсинга HTML и XML информации сайта. Были собраны данные о заголовках тредов, авторах, датах постов, тексте постов и упоминаниях других пользователей.
Предобработка данных
Была разработана структурированная методика для выборки когорты и маркировки исходов. Пользователи с высоким риском были определены на основе постов о попытках суицида. Были выделены 48 ВРП и 144 контрольных пользователя.
Квантификация активности форума на основе сетей
Была разработана схема квантификации активности форума, основанная на взаимодействиях в тредах. Были построены сети взаимодействий и выделены эгоцентрические сети для каждого пользователя.
Выделение сетевых структурных характеристик
Были вычислены 17 сетевых характеристик, включая плотность, транзитивность, центральность входной и выходной степени. Эти характеристики были использованы для обучения модели машинного обучения.
Моделирование и интроспекция машинного обучения
Использовалась модель логистической регрессии с эластичной сетью для прогнозирования статуса ВРП. Модель была оценена с помощью метрик чувствительности, специфичности, F1-скора и AUC. Были использованы методы SHAP для анализа влияния характеристик на прогнозы модели.
Результаты
Модель машинного обучения достигла AUC=0.73, что указывает на значительную способность прогнозировать ВРП на основе сетевых характеристик социальных взаимодействий. Наиболее важными характеристиками были транзитивность, плотность и центральность входной степени. Модель также показала, что ВРП чаще являются целями социальных обменов с меньшей частотой и имеют эгоцентрические сети с "малым миром" свойствами.
Исследование подчеркивает важность сетевых характеристик в прогнозировании суицидального риска и предлагает интеграцию этих характеристик в будущие исследования СМП.