Интересное сегодня
Эффективность контроля внимания: новые подходы к исследовани...
Введение Люди, как принято считать, действуют добровольно, когда могут выразить три способности: (1)...
Как мозг регулирует стресс и поведение: открытие ключевого ц...
Прорыв в понимании мозга: обнаружен ключевой регулятор стресса и поведения Новое исследование Калиф...
Влияние незнакомого экспериментатора на управление вниманием...
Введение Когнитивный контроль — это целенаправленное регулирование мыслей и действий, что крайне важ...
Социальная интеграция мигрантов в Китае: факторы и региональ...
Введение Социальная дифференциация и социальная интеграция, вызванные растущей мобильностью населени...
Понимание намерений дизайнеров перейти на инструменты рисова...
Введение В последние годы инструменты рисования с искусственным интеллектом (ИИ) значительно изменил...
Роль контрастных признаков в зрительном восприятии крыс: исс...
Введение в визуальное восприятие паттернов Все сложные зрительные задачи, такие как распознавание об...
Суицидальные мысли и поведение (СМП) сильно стигматизированы и являются табу. Несмотря на цензуру, они широко распространены в интернете, и их обнаружение может быть улучшено за счет разработки уникально полезных цифровых маркеров. В данном исследовании мы сосредоточились на форуме "Sanctioned Suicide", где обсуждаются темы суицида без цензуры. Мы выявили 17 эгоцентрических сетевых характеристик, чтобы захватить динамику социальных взаимодействий и вовлеченности в этом уникальном сообществе. Используя сетевые данные, полученные из более чем 3,2 миллиона уникальных взаимодействий 192 человек, 48 из которых были определены как пользователи с высоким риском (ВРП), мы обучили, проверили и протестировали модель классификации машинного обучения для прогнозирования статуса ВРП.
Методы
Исследование использовало данные с форума "Sanctioned Suicide", где пользователи могут анонимно обсуждать темы суицида. Были собраны данные о более чем 600,000 постах в 40,000 треддах и 11,000 пользователей. Данные были анонимизированы и обработаны для выделения сетевых характеристик.
Сбор данных
Данные были собраны с помощью скрипта на Python, который использовал библиотеку BeautifulSoup для парсинга HTML и XML информации сайта. Были собраны данные о заголовках тредов, авторах, датах постов, тексте постов и упоминаниях других пользователей.
Предобработка данных
Была разработана структурированная методика для выборки когорты и маркировки исходов. Пользователи с высоким риском были определены на основе постов о попытках суицида. Были выделены 48 ВРП и 144 контрольных пользователя.
Квантификация активности форума на основе сетей
Была разработана схема квантификации активности форума, основанная на взаимодействиях в тредах. Были построены сети взаимодействий и выделены эгоцентрические сети для каждого пользователя.
Выделение сетевых структурных характеристик
Были вычислены 17 сетевых характеристик, включая плотность, транзитивность, центральность входной и выходной степени. Эти характеристики были использованы для обучения модели машинного обучения.
Моделирование и интроспекция машинного обучения
Использовалась модель логистической регрессии с эластичной сетью для прогнозирования статуса ВРП. Модель была оценена с помощью метрик чувствительности, специфичности, F1-скора и AUC. Были использованы методы SHAP для анализа влияния характеристик на прогнозы модели.
Результаты
Модель машинного обучения достигла AUC=0.73, что указывает на значительную способность прогнозировать ВРП на основе сетевых характеристик социальных взаимодействий. Наиболее важными характеристиками были транзитивность, плотность и центральность входной степени. Модель также показала, что ВРП чаще являются целями социальных обменов с меньшей частотой и имеют эгоцентрические сети с "малым миром" свойствами.
Исследование подчеркивает важность сетевых характеристик в прогнозировании суицидального риска и предлагает интеграцию этих характеристик в будущие исследования СМП.