Адаптивные интервенции на ходу: как справляться с отсутствующими данными в микрорандомизированных испытаниях

Адаптивные интервенции на ходу: как справляться с отсутствующими данными в микрорандомизированных испытаниях

Интересное сегодня

Как серотонин в мозжечке влияет на тревожность: Новые исслед...

Новые исследования раскрывают, что серотонин в мозжечке играет важную роль в регуляции тревожности. ...

Психотические и диссоциативные симптомы: связь с метакогнити...

Проспективное исследование позитивных психотических симптомов, диссоциативных симптомов и метакогнит...

Самосострадание: как научиться относиться к себе по-доброму

Что такое самосострадание Самосострадание — это практика обращения с самим собой так, как вы бы обра...

Что такое брекетинг в качественных исследованиях: методы и п...

Что такое брекетинг в качественных исследованиях? Брекетинг (также известный как эпохэ или феноменол...

Оценка физических функций в волейбольных тренировках на осно...

Введение С развитием спортивной науки традиционные методы оценки физических функций всё чаще не соот...

Различия в обучении, удержании и обобщении: сравнение de nov...

Введение Движение требует способности учиться на ошибках. Такой процесс обработки ошибок можно разде...

Дизайн исследования MARS
Дизайн исследования MARS
Доля завершенных оценок исхода по точкам принятия решений
Доля завершенных оценок исхода по точкам принятия решений
Изменения в количестве точек принятия решений, доступных для анализа, из-за различных источников отсутствующих данных. Эти изменения в размере выборки влияют как на смещение, так и на точность оценочных эффектов интервенции.
Изменения в количестве точек принятия решений, доступных для анализа, из-за различных источников отсутствующих данных. Эти изменения в размере выборки влияют как на смещение, так и на точность оценочных эффектов интервенции.
Thumbnail 1
Thumbnail 2
Thumbnail 3
Оригинал исследования на сайте автора

Введение

В современном мире более 90% взрослых американцев имеют смартфон (Pew Research Center, 2024). Широкое распространение и зависимость от смартфонов и других цифровых технологий создали основу для развития мобильного здравоохранения (mobile health). На протяжении последних десятилетий психологи активно исследуют способы использования цифровых технологий для удовлетворения потребностей в психологических интервенциях. Цифровые интервенции теперь применяются для улучшения качества жизни в различных областях, таких как снижение симптомов депрессии (Fu et al., 2020; Moshe et al., 2021), лечение тревожных расстройств (Pauley et al., 2023; Stefanopoulou et al., 2019), справление со стрессом (Harrer et al., 2024), управление болью (Eather et al., 2022; Palermo et al., 2020), улучшение психологического благополучия (Armaou et al., 2020; Ferrari et al., 2022; Saboor et al., 2024), поддержка снижения и прекращения употребления психоактивных веществ (Bonfiglio et al., 2022; Fu et al., 2020; Nesvåg & McKay, 2018) и поощрение здорового питания (Chen et al., 2020; Thomas et al., 2024).

В различных областях исследователи призывают к будущей работе по разработке индивидуального, персонализированного подхода к психологическим интервенциям (Chen et al., 2020; Eather et al., 2022; Fu et al., 2020; MoeByrne et al., 2022; Moshe et al., 2021).

Адаптивные интервенции на ходу (Just-in-Time Adaptive Interventions, JITAIs) представляют собой продвинутый шаг в использовании цифровых технологий для предоставления психологических интервенций в режиме реального времени в реальных условиях. JITAIs используют динамическую информацию об опыте и контексте индивида для принятия решения о том, следует ли и как вмешаться (NahumShani et al., 2018). Они разработаны для реагирования на быстро меняющийся риск неблагоприятных исходов у индивидов и для использования моментов, благоприятных для позитивных изменений (NahumShani et al., 2015).

Например, рассмотрим JITAI, использующую мобильное приложение, которое отправляет цифровые уведомления для поддержки отказа от курения (Battalio et al., 2021). На основе сенсорной оценки уровня стресса у индивида каждые 2 часа принимается решение о том, следует ли отправить пользователю стратегию регуляции стресса. Если обнаружен стресс, отправляется сообщение с рекомендацией упражнения по регуляции стресса; в противном случае сообщение не отправляется.

JITAIs тесно связаны с концепцией продвижения прецизионной медицины (precision medicine) в психотерапии; они разработаны для предоставления необходимого объема поддержки в нужное время и в нужном месте, не более того (NahumShani et al., 2018; Zipfel et al., 2024). Такой подход к интервенциям основан на теориях, предполагающих, что психологические процессы динамичны и изменчивы, и что люди в любой момент времени подвержены влиянию комплекса внешних сил (Cohen et al., 2017). Следовательно, вмешательство в переломные моменты, когда люди уязвимы к неблагоприятным исходам и восприимчивы к поддержке, имеет решающее значение для эффективного и экономически выгодного содействия поведенческим изменениям (Cohen et al., 2017; NahumShani et al., 2018).

Микрорандомизированные испытания (MRT) как инструмент оптимизации JITAIs

Для создания эффективных JITAIs исследователям нужны эмпирические знания, например, какие интервенции более эффективны для достижения желаемых краткосрочных результатов и насколько хорошо различные интервенции работают в разных контекстах. Вопросы, касающиеся оптимального дизайна JITAIs, могут быть решены путем проведения микрорандомизированных испытаний (micro-randomized trials, MRT) (Liao et al., 2016; Qian, Walton et al., 2022b). MRT — это экспериментальный дизайн, который использует быстрое последовательное рандомизацию для различных вариантов интервенций. Это означает, что один и тот же участник может быть рандомизирован многократно для разных вариантов интервенций, а временной интервал между рандомизациями может быть относительно коротким (например, несколько дней, часов или минут).

MRT — это экспериментальный дизайн, ориентированный на оптимизацию интервенций; то есть данные, полученные в MRT, используются для получения выводов о том, как конструировать JITAIs (Walton et al., 2018). Фокус MRT на оптимизации отличается от стандартных рандомизированных контролируемых испытаний (РКИ, randomized controlled trials, RCT), которые сосредоточены на оценке существующей программы интервенции по сравнению с контрольной группой (Collins & Collins, 2018). Хотя РКИ критически важны для определения общей эффективности программы интервенции, они часто не предоставляют много информации о том, как улучшить интервенцию. Поэтому было высказано мнение, что логичный подход к разработке мощных цифровых интервенций включает проведение оптимизационных испытаний, таких как MRT, для доработки интервенции перед ее оценкой в РКИ (Szeszulski & Guastaferro, 2024).

Существует растущий объем исследований, посвященных MRT. С момента появления этого дизайна в 2015 году (Klasnja et al., 2015) он был обсужден и реализован более чем в 80 опубликованных исследованиях (по данным PubMed). Национальные институты здравоохранения (National Institutes of Health, NIH) профинансировали не менее 34 проектов, связанных с MRT (по данным NIH RePORT). Эти проекты охватывают такие области, как клиническая психология (например, интервенции при проблемах психического здоровья), психология здоровья (например, интервенции, способствующие здоровому образу жизни), социальная психология (например, интервенции, учитывающие социальные влияния и групповую динамику) и трансляционные исследования (например, применение научных данных для разработки практически эффективных интервенций).

Сбор данных в MRT и проблема отсутствующих данных

MRT используют несколько режимов сбора данных для получения богатых и гранулированных данных по каждому участнику. Например, опыт и поведение участников могут оцениваться после каждой рандомизации с помощью экологической моментальной оценки (ecological momentary assessment, EMA) (Shiffman et al., 2008; Smyth & Stone, 2003), что позволяет анализировать краткосрочные преимущества одного варианта интервенции по сравнению с другим. Также используются изменяющиеся во времени переменные для описания контекстов, в которых происходили рандомизации (например, данные сенсоров, собранные на смартфонах, используются для классификации минут как «вероятно, стрессовые» или «вероятно, не стрессовые») (Battalio et al., 2021). Эта информация может быть использована для исследования условий, при которых один вариант интервенции более выгоден, чем другой (например, более ли эффективны сообщения в моменты «вероятно, стресса» или «вероятно, отсутствия стресса»). Широкий набор статических, индивидуальных характеристик собирается при исходной оценке, которая может быть использована для определения того, как индивидуальные характеристики и поведенческая история влияют на эффективность различных вариантов интервенций.

Учитывая интенсивный, мультимодальный характер сбора данных в MRT, отсутствующие данные неизбежны.

Последствия отсутствующих данных в MRT

Отсутствующие данные в MRT ограничивают возможности исследователей отвечать на научные вопросы:

  • Снижение статистической мощности: Отсутствующие данные уменьшают количество участников и случаев рандомизации, доступных для анализа, тем самым снижая статистическую мощность для выявления эффектов интервенции. В отличие от рандомизированных испытаний, которые оценивают исходы в конце исследования, эффекты интервенции в MRT оцениваются на основе интенсивных продольных данных об исходах, поэтому весьма вероятно, что у большинства участников будут отсутствовать некоторые данные по переменной исхода.
  • Смещение оценок эффектов: Отсутствующие данные могут подорвать точность оценки эффектов интервенции, если вероятность отсутствия данных варьируется между участниками и во времени. Например, эффект интервенции может быть смещен, если отсутствующие данные более распространены в определенных подгруппах или обстоятельствах, и если интервенция работает по-разному для этих индивидов или в этих обстоятельствах. Предположим, что когда участники испытывают стресс, они менее склонны следовать предлагаемой интервенции и также менее склонны сообщать о своем исходе через EMA. Наблюдаемые данные могут чрезмерно представлять моменты, когда предлагаемые интервенции хорошо принимаются, что приводит к переоценке эффекта интервенции.
  • Влияние на будущие JITAIs: Во многих реальных ситуациях отсутствующие данные в MRT могут означать, что отсутствующие данные будут и в будущих JITAIs. Данные MRT могут быть проанализированы для получения практических выводов о том, как справляться с отсутствием данных в JITAIs. Например, если информация об уровне стресса участников иногда отсутствует во время MRT, потому что участники забывают носить датчик для определения стресса, то, скорее всего, эта информация также будет иногда отсутствовать во время будущей JITAI по той же причине. JITAI должна включать протокольные правила о том, как действовать в обстоятельствах, когда информация об участниках отсутствует, и эти правила могут быть эмпирически разработаны путем анализа отсутствующих данных в MRT.

Научные и практические последствия отсутствующих данных в MRT редко обсуждались в предыдущих исследованиях (за исключением Kondo & Oba, 2024; Seewald et al., 2019), что ограничивает возможности исследователей планировать стратегии минимизации и устранения отсутствующих данных. Чтобы устранить этот пробел, данная статья описывает множественные источники отсутствующих данных в MRT и их различные последствия для смещения (т.е. систематического отклонения от истинного эффекта интервенции) и точности (т.е. дисперсии оценочного эффекта интервенции) оценочных эффектов интервенции, а также их последствия для практического дизайна JITAIs. Наша цель — предоставить рекомендации исследователям по минимизации и устранению различных типов отсутствующих данных в MRT.

Ключевые компоненты JITAIs и пример MRT

Компоненты JITAIs

JITAIs включают следующие компоненты: конечные исходы (distal outcomes), промежуточные исходы (proximal outcomes), варианты интервенций, переменные для адаптации (tailoring variables), точки принятия решений (decision points) и правила принятия решений (decision rules) (NahumShani et al., 2023; Qian, Walton et al., 2022b). Определения и примеры из исследования MARS (описано ниже) приведены в Таблице 1.

Таблица 1. Определения и примеры компонентов JITAI
Компонент Определение Пример в MARS
Конечный исход (Distal Outcome) Долгосрочный исход, на который направлена интервенция. Снижение количества выкуренных сигарет в день.
Промежуточный исход (Proximal Outcome) Краткосрочный поведенческий или психологический процесс, на который непосредственно нацелена интервенция. Применение стратегий саморегуляции для борьбы с желанием курить в течение следующего часа.
Варианты интервенций (Intervention Options) Различные действия, которые могут быть предприняты для воздействия на промежуточный исход. 1. Отсутствие подсказки. 2. Подсказка с низкозатратной стратегией саморегуляции. 3. Подсказка с более высокозатратной стратегией саморегуляции.
Переменные для адаптации (Tailoring Variables) Переменные, используемые для персонализации интервенции. Негативные эмоции, наличие сигарет, уровень стресса.
Точки принятия решений (Decision Points) Моменты времени, когда может быть принята возможность вмешательства. Каждые 2 часа в течение дня.
Правила принятия решений (Decision Rules) Алгоритм, определяющий, когда и как применять интервенцию на основе переменных для адаптации. Если участник испытывает негативные эмоции и имеет доступ к сигаретам, отправляется подсказка с низкой затратностью.

Пример MRT: Mobile Assistance for Regulating Smoking (MARS)

MARS — это 10-дневное MRT, которое исследовало эффект предоставления цифровых подсказок для поощрения использования стратегий саморегуляции для отказа от курения (NahumShani, Potter et al., 2021a). Рисунок 1 кратко обобщает дизайн исследования MARS и показывает, как собранные данные служат различным целям для интервенции и оценки исследования. Более подробная информация о дизайне MARS представлена в Potter et al. (Under Review).

Дизайн исследования MARS
Рисунок 1. Дизайн исследования MARS. Примечание 1. Рандомизация проводилась либо сразу после ответа на два вопроса, либо через две минуты после их проведения.

Участников просили использовать мобильное приложение, которое содержало весь контент интервенции. Каждый день исследования содержал шесть точек принятия решений, разделенных интервалами примерно в 2 часа. В течение каждого 2-часового интервала проверялась пригодность для рандомизации. Точка принятия решений рандомизировалась только в том случае, если она считалась пригодной для рандомизации, то есть все экспериментально протестированные варианты интервенции считались подходящими в то время. В MARS пригодные точки принятия решений определялись как те, при которых участник не находился за рулем и не включал режим конфиденциальности на своем телефоне. Если точка принятия решений была пригодной, задавались два вопроса: о негативных эмоциях участника (да/нет) и о наличии сигарет (да/нет). Если участники отвечали на эти вопросы, они немедленно рандомизировались по одному из трех вариантов интервенции; в противном случае они рандомизировались через 2 минуты.

Три варианта интервенции включают: (1) отсутствие подсказки, (2) подсказка, рекомендующая низкозатратную стратегию саморегуляции, и (3) подсказка, рекомендующая более высокозатратную стратегию саморегуляции. Низкозатратные подсказки были адаптированы на основе ответов участника на два вопроса (то есть подсказки выбирались из четырех наборов сообщений, составленных на основе ответов «да/нет» на два вопроса). Если участник не отвечал на вопросы, низкозатратные подсказки выбирались из набора сообщений для случаев, когда участники сообщали об отсутствии негативных эмоций и отсутствии сигарет. Более высокозатратные подсказки не были адаптированы; они рекомендовали одно из пяти случайно выбранных когнитивных или основанных на внимательности упражнений, к которым участник мог получить доступ в мобильном приложении. Через час после каждой рандомизации участникам предлагалось пройти EMA, которая включала пункты, относящиеся к использованию участниками стратегий саморегуляции за последний час, а также их эмоциям, употреблению психоактивных веществ и внутриличностной и контекстной информации. Если точка принятия решений не была пригодной для микрорандомизации, то EMA по дизайну не доставлялась.

В дополнение к использованию мобильного приложения, участникам также было предложено пройти три очных визита в дни 1, 4 и 10. Во время этих визитов участники заполняли анкеты, измеряющие такие конструкты, как их социодемографические характеристики, а также факторы риска и защиты, связанные с употреблением табака.

MARS имел три заранее определенные аналитические цели. Основная цель заключалась в оценке среднего промежуточного эффекта подсказки (по сравнению с отсутствием подсказки) на самоотчет участника об использовании стратегий саморегуляции в течение следующего часа. Вторичная цель MARS заключалась в оценке среднего промежуточного эффекта подсказки с низкозатратной стратегией по сравнению с подсказкой с более высокозатратной стратегией на самоотчет об использовании стратегий саморегуляции в течение следующего часа. Исследовательские анализы изучали, были ли эффекты подсказок, указанных в основной и вторичной целях, модерированы контекстами и опытом участников. Все анализы использовали данные от 99 участников в период с 2 по 9 день исследования (были включены только дни 2-9, поскольку в дни 1 и 10 было очень мало рандомизаций; также были проведены несколько анализов чувствительности для оценки надежности результатов). Это соответствовало общему числу 4752 точек принятия решений (99 участников × 8 дней × 6 точек принятия решений в день). Результаты MARS представлены в Potter et al. (Under Review).

Отсутствующие данные в различных типах переменных MRT

В этом разделе мы подробно опишем, как отсутствующие данные в различных типах переменных MRT имеют разные последствия для а) оценок эффектов интервенции (смещение), б) точности (дисперсии) оценок эффектов интервенции и в) будущих JITAIs на практике. Таблица 2 обобщает определения переменных, показывает их соответствие примеру MARS, приводит примеры пунктов вопросов и иллюстрирует временное согласование этих переменных в анализе. Приложение 1 содержит пошаговые инструкции с использованием кода R и искусственных данных для демонстрации анализов и методов.

Таблица 2. Определения ключевых переменных MRT
Тип переменной Определение Пример в MARS Временное соответствие в анализе
Промежуточный исход Краткосрочный исход, на который непосредственно нацелена интервенция. Использование стратегий саморегуляции в течение следующего часа. Измеряется через 1 час после рандомизации.
Ковариаты Переменные, не являющиеся основным предметом исследования, но включаемые для повышения точности оценки эффекта интервенции. Возраст, пол, семейное положение, доход, история употребления табака. Измеряются в начале исследования или в момент принятия решения.
Встроенные переменные для адаптации (ограничивающие рандомизацию) Переменные, используемые для определения пригодности точки принятия решений для рандомизации. Находится ли участник за рулем, включен ли режим конфиденциальности. Оцениваются до принятия решения о рандомизации.
Встроенные переменные для адаптации (не ограничивающие рандомизацию) Переменные, используемые для настройки содержания интервенции, но не влияющие на пригодность для рандомизации. Негативные эмоции, наличие сигарет. Оцениваются перед предоставлением подсказки.
Кандидаты для переменных адаптации Переменные, измеряемые во время MRT, которые исследуются на предмет их полезности в качестве переменных для адаптации в будущих JITAIs. Эмоциональный опыт, ментальная емкость, рискованное поведение (измеренные в предыдущей точке принятия решений). Измеряются до или во время точки принятия решений.

Промежуточный исход (Proximal Outcome)

Основной исход в MRT — это промежуточный исход, представляющий краткосрочные поведенческие или психологические процессы, которые призваны изменить варианты интервенций. В MARS основным промежуточным исходом является бинарный индикатор участия участников в стратегиях саморегуляции в течение часа после рандомизации (1 = любое участие; 0 = отсутствие участия).

Импликации для оценок (смещение)

Анализ полных случаев (complete-case analysis) остается наиболее распространенным подходом к обработке отсутствующих данных в анализах MRT. При анализе полных случаев исключаются точки принятия решений с пропущенными значениями в любой из переменных в аналитической модели, включая промежуточный исход, ковариаты (см. раздел «Ковариаты») или кандидаты в модераторы (см. раздел «Кандидаты для переменных адаптации для будущих JITAIs»); эффекты интервенции оцениваются только на основе точек принятия решений, для которых имеются полные данные по всем переменным в аналитической модели.

Исключение точек принятия решений с отсутствующими данными по промежуточному исходу нарушает принцип анализа по намерению лечить (intention-to-treat analysis) (Alshurafa et al., 2012) и может нарушить баланс как наблюдаемых, так и ненаблюдаемых факторов, установленных рандомизацией. В результате эффекты интервенции, оцененные с использованием только полных данных по промежуточному исходу, могут быть смещены. Хотя невозможно определить степень смещения оценочного эффекта интервенции только по наблюдаемым данным, свидетельства потенциального смещения могут быть получены путем изучения закономерностей отсутствия данных. В частности, исследователи могут оценить связь между характеристиками и контекстами участников, а также распространенностью отсутствующих данных. Сильные связи между частотой отсутствия данных и определенными условиями могут указывать на то, что распространенность отсутствующих данных зависит от этих условий; в таких случаях результаты MRT при анализе полных случаев следует интерпретировать с осторожностью.

Чтобы проиллюстрировать один из типов анализа, который может быть выполнен для исследования закономерностей отсутствия данных, мы изучили, как объем самоотчетных данных по основному промежуточному исходу изменялся со временем и варьировался среди участников с различными социодемографическими характеристиками, используя данные MARS. Во-первых, мы построили график доли завершенных оценок исхода для 99 участников в каждой точке принятия решений на Рисунке 2 (доля = количество завершенных оценок исхода / количество точек принятия решений, пригодных для рандомизации). Рисунок 2 демонстрирует, что скорость завершения была стабильно низкой в последнем 2-часовом интервале каждого дня исследования, поэтому промежуточный исход подсказок в более поздней части дня был недопредставлен в аналитических данных. Если эффективность интервенции варьировалась к концу дня, оценочный эффект интервенции, основанный на полных данных исхода, может быть смещен.

Доля завершенных оценок исхода по точкам принятия решений
Рисунок 2. Доля завершенных оценок исхода по точкам принятия решений.

Далее мы обнаружили, что объем отсутствующих данных существенно варьировался между участниками. Для изучения наличия систематических закономерностей в возникновении отсутствия данных мы подогнали отдельные модели линейной регрессии для оценки связей между социодемографическими характеристиками участников в начале исследования (то есть возрастом, полом, расой/этнической принадлежностью, доходом, семейным положением и историей употребления табака) и долей отсутствия данных в промежуточном исходе для каждого участника. Были получены некоторые свидетельства того, что латиноамериканцы (референтная категория — нелатиноамериканцы, белые) были более склонны иметь пропущенные значения в основном промежуточном исходе. Напротив, участники с историей более интенсивного употребления табака имели тенденцию иметь меньше пропущенных значений в промежуточном исходе (по сравнению с теми, кто имел историю более легкого употребления табака), что может отражать их повышенную мотивацию участвовать в интервенции по отказу от курения. Если подсказки имели разные эффекты среди этих подгрупп, то отсутствие данных в промежуточном исходе может внести смещение в оценочный эффект подсказки на последующее участие в стратегиях саморегуляции.

Эти анализы предполагают способы исследования возможного смещения в оценочных эффектах интервенции. Если не обнаружено значительной связи между важными наблюдаемыми переменными и отсутствием данных, исследователи могут быть более уверены в том, что отсутствие данных в промежуточном исходе не приводит к вводящим в заблуждение выводам об эффектах интервенции. Однако важно признать, что это не устраняет возможность смещения. Оценочные эффекты интервенции могут по-прежнему быть смещены, если, например, закономерность отсутствия данных связана с самим промежуточным исходом (т.е. механизм отсутствия данных не случаен; Rubin, 1976), но это не может быть обнаружено по наблюдаемым данным.

Импликации для дисперсии (точности)

При анализе полных случаев данных MRT эффекты интервенции оцениваются только по точкам принятия решений с непропущенными значениями промежуточного исхода. В MARS процент отсутствия данных по основному промежуточному исходу составил 35% (1337 из 3860 точек принятия решений, пригодных для рандомизации). Это отсутствие данных уменьшило количество точек принятия решений, доступных для анализа, и, в свою очередь, снизило точность оценочных эффектов интервенции по сравнению с точностью, которая могла бы быть получена, если бы не было отсутствующих данных.

Ковариаты (Covariates)

Ковариаты в данном контексте — это переменные, которые не являются основным предметом научного интереса, но включаются в анализ как дополнительные предикторы промежуточного исхода с целью повышения точности оценочного эффекта интервенции (то есть снижения стандартных ошибок) (Qian, Cohn et al., 2022a, Qian, Walton et al., 2022b; Shi et al., 2025). Например, в той мере, в какой возраст связан с вовлеченностью в саморегуляцию, включение возраста в качестве ковариаты в основной анализ MARS может снизить стандартную ошибку для оценочного эффекта подсказки (по сравнению с отсутствием подсказки) на вовлеченность в саморегуляцию. В MRT ковариаты могут включать статические индивидуальные характеристики, измеренные в начале исследования, и/или изменяющиеся во времени переживания/поведение, измеренные до каждой точки принятия решения и в момент ее наступления.

В рандомизированных испытаниях соображения, касающиеся выбора и интерпретации ковариат, отличаются от таковых в обсервационных исследованиях. Во-первых, коэффициенты ковариат не являются основным предметом научного интереса, поскольку цель рандомизированных испытаний почти всегда состоит в оценке эффектов, связанных с рандомизированными интервенциями. Ковариаты включаются в основном для повышения точности оценочных эффектов интервенции. Во-вторых, и это связано с предыдущим пунктом, ковариаты не являются обязательными для получения несмещенной оценки эффекта интервенции (Boruvka et al., 2018; Qian, Cohn et al., 2022a, Qian, Walton et al., 2022b; Shi et al., 2025), поскольку процедура рандомизации уже разработана для балансировки распределений ковариат между экспериментальными условиями. Эти соображения, вероятно, приводят к уникальной точке зрения на управление отсутствующими данными в ковариатах в рандомизированных испытаниях, а именно: стратегии обработки отсутствия данных в ковариатах в первую очередь должны обеспечивать, чтобы оценочный эффект интервенции был несмещенным и точным; несмещенность и точность оценочных коэффициентов ковариат имеют второстепенное значение. Фактически, пакет R MRTAnalysis, используемый для оценки причинных эффектов для MRT, по умолчанию не выводит коэффициенты ковариат (Qian et al., 2023).

С учетом этих соображений мы обсуждаем последствия анализа полных случаев и перспективную альтернативу — метод индикатора отсутствия данных (missing indicator method). Метод индикатора отсутствия данных — это практичная и эффективная стратегия для обработки отсутствующих данных в ковариатах при оценке среднего эффекта интервенции в стандартных РКИ (Groenwold et al., 2012; Kamat & Reiter, 2021; Sullivan et al., 2018; White & Thompson, 2005; Zhao & Ding, 2024). Он заключается в том, что пропущенные значения ковариаты рассматриваются как их собственная категория, и создается отдельный индикатор для обозначения отсутствия данных. Например, использование метода индикатора отсутствия данных для переменной «доход» включает замену пропущенных значений дохода константой (например, общим средним; выбор константы влияет только на свободный член в регрессионной модели, используемой для анализа данных), создание новой бинарной переменной для обозначения отсутствия данных (например, 0 для заявленного дохода и 1 для отсутствующего дохода), а затем включение как импутированного среднего дохода, так и индикатора отсутствия данных в качестве пары ковариат в последующих анализах. Приложение 2 содержит подробное объяснение этого метода. В РКИ простой подход, такой как метод индикатора отсутствия данных, может помочь устранить влияние отсутствующих данных в ковариатах — помогая избежать смещения и завышенной дисперсии (Groenwold et al., 2012; Kamat & Reiter, 2021; Sullivan et al., 2018; White & Thompson, 2005; Zhao & Ding, 2024). В MRT, по крайней мере, для базовых ковариат, метод индикатора отсутствия данных может быть так же полезен, при этом требуются дополнительные исследования для подтверждения его полезности при управлении отсутствующими данными в изменяющихся во времени ковариатах.

Импликации для оценок (смещение)

Отсутствие данных в ковариатах может сместить оценочные средние эффекты интервенции, если выполняется анализ полных случаев. Исключая точки принятия решений с отсутствующими данными в ковариатах, нарушается принцип анализа по намерению лечить. Оценочный эффект интервенции смещен в той степени, в которой эффективность вариантов интервенции различается между участниками и/или точками принятия решений с отсутствующими ковариатами и теми, у кого они полные. Во многих случаях можно предвидеть уровень отсутствия данных в часто используемых ковариатах. Например, существуют свидетельства того, что вопросы на деликатные темы, такие как «доход», как правило, содержат значительное количество отсутствующих данных, и это отсутствие данных может быть особенно распространено среди лиц с очень высоким или очень низким доходом (Frick & Grabka, 2014; Tourangeau & Yan, 2007). Таким образом, если принимается решение о проведении анализа полных случаев, рекомендуется избегать ковариат с большой долей пропущенных значений. Важно, что выбор ковариат должен быть заранее определен до сбора или анализа данных MRT, чтобы обеспечить целостность результатов.

Помимо избегания ковариат, которые, как ожидается, будут частично отсутствовать, влияние отсутствующих ковариат на смещение эффекта интервенции также может быть смягчено альтернативными спецификациями моделей, такими как метод индикатора отсутствия данных. Хотя метод индикатора отсутствия данных считается недействительным для обработки отсутствующих данных в обсервационных исследованиях (Graham, 2009; Schafer & Graham, 2002), он может быть действительным для оценки средних эффектов интервенции для рандомизированных испытаний. Теоретическая основа этого метода изначально была разработана в контексте стандартных РКИ (Groenwold et al., 2012; Kamat & Reiter, 2021; Sullivan et al., 2018; White & Thompson, 2005; Zhao & Ding, 2024); аналогичные рассуждения могут поддержать его применение для обработки отсутствующих ковариат в MRT при оценке среднего эффекта интервенции. В частности, действительность (несмещенность) оценочного эффекта интервенции основана на процедуре рандомизации. Смещение эффекта интервенции из-за отсутствующих ковариат может быть избегнуто до тех пор, пока стратегия обработки отсутствующих данных сохраняет независимость назначения интервенции от ковариат и также включает всех участников и точки принятия решений в анализ. Простой метод спецификации модели, такой как метод индикатора отсутствия данных, достигает именно этих целей. Однако критически важно подчеркнуть, что при использовании метода индикатора отсутствия данных только средний оценочный эффект интервенции является несмещенным; оценочные коэффициенты ковариат могут быть смещены и не должны интерпретироваться. Это связано с тем, что ковариаты по-прежнему коррелируют друг с другом; использование индикаторов отсутствия данных искажает оценочную ковариационную структуру между ковариатами и исходом, что приводит к завышению или занижению прогностических эффектов ковариат на исход.

Импликации для дисперсии (точности)

Отсутствующие данные уменьшают размер выборки при анализе полных случаев и влияют на точность оценок модели. Потеря точности из-за отсутствующих данных в ковариатах может уменьшить и даже свести на нет прирост точности от включения ковариат в модель. Например, рассмотрим список ковариат, которые были заранее определены для анализа MARS (например, возраст, пол, семейное положение, доход, история употребления табака и основной промежуточный исход, измеренный в наиболее недавней пригодной точке принятия решений); 32% (799/2523) точек принятия решений содержали пропущенные значения хотя бы в одной из ковариат. Использование этих ковариат при анализе полных случаев существенно сократило бы количество точек принятия решений, доступных для оценки эффектов интервенции. Весьма вероятно, что включение ковариат с пропущенными значениями может противоречить цели повышения эффективности оценки.

Метод индикатора отсутствия данных — это простой подход, который использует предсказательную силу неполной информации в отсутствующих ковариатах (то есть не приходится удалять столбцы с отсутствующими данными) и при этом сохраняет аналитический размер выборки (то есть также не удаляет строки). Предполагается, что он имеет хорошую асимптотическую эффективность (Zhao & Ding, 2024). Однако эта эффективность не гарантирована в малых выборках, поскольку для каждой ковариаты, содержащей отсутствующие значения, создается индикатор отсутствия данных, что приводит к быстрому увеличению числа предикторов с более высоким риском переобучения (White & Thompson, 2005; Zhao & Ding, 2024).

Встроенные переменные для адаптации, которые ограничивают рандомизацию

Встроенные переменные для адаптации — это те, которые интегрированы в MRT по дизайну. В MRT априорные знания, основанные на предыдущих исследованиях, теориях или опыте, могут использоваться для ограничения рандомизации, а именно: рандомизация по вариантам интервенций происходит только в условиях, когда эти варианты считаются подходящими на основе научных, клинических, практических и этических соображений (Qian, Walton et al., 2022b). Статус пригодности каждой точки принятия решений — это бинарный индикатор, который различает точки принятия решений, соответствующие заранее определенным условиям и, следовательно, считающиеся пригодными для рандомизации, и те, которые не соответствуют этим условиям (также используется термин «доступность»; например, Boruvka et al., 2018; Klasnja et al., 2015; Seewald et al., 2019). Например, в MARS точка принятия решений была пригодна для рандомизации, если человек не водил машину и не включал режим конфиденциальности на телефоне. Другими словами, статус пригодности — это форма встроенных переменных для адаптации, которые определяют, будут ли рандомизироваться точки принятия решений.

Когда информация, необходимая для определения пригодности точки принятия решений, отсутствует во время испытания (например, если данные о вождении и режиме конфиденциальности отсутствуют в случае MARS), неясно, следует ли рандомизировать точку принятия решений. Исследователи могут спланировать MRT для обработки этой ситуации. Один из вариантов — рассматривать точки принятия решений с отсутствующей информацией о пригодности как пригодные и рандомизировать их; другой вариант — рассматривать их как непригодные и не рандомизировать. Это решение должно основываться на таких соображениях, как усилия и нагрузка, требуемые от участников для взаимодействия с вариантами интервенции, финансовые затраты, связанные с их предоставлением (например, если вариант интервенции включает стимулы), и предполагаемая вероятность того, что точки принятия решений с отсутствующей информацией о пригодности состоят из случаев, которые на самом деле не должны быть рандомизированы (например, вероятность того, что участники фактически управляют автомобилем, когда их статус вождения отсутствует).

Импликации для оценок (смещение)

В MRT, где рандомизации ограничены пригодными точками принятия решений, оценочный эффект интервенции является условным и должен концептуализироваться как разница в промежуточном исходе между различными вариантами интервенции, предоставленными в точках принятия решений, пригодных для рандомизации (Boruvka et al., 2018; Qian, Cohn et al., 2022a). Таким образом, то, считаются ли точки принятия решений с отсутствующей информацией о пригодности пригодными и, следовательно, рандомизированными, изменяет смысл и значение эффекта интервенции, который пытаются оценить. В частности, когда исследователи решают рандомизировать точки принятия решений с отсутствующей информацией о пригодности, средний эффект интервенции представляет собой комбинацию эффекта в точках принятия решений, классифицированных как пригодные на основе полной информации, и эффекта в точках принятия решений, для которых отсутствует информация о пригодности. Предположим, есть основания полагать, что варианты интервенции, предоставляемые в непригодных точках принятия решений, в основном неэффективны (например, участники не взаимодействуют с телефонными сообщениями, отправленными, когда они не могут использовать свои телефоны, поэтому отправка сообщений не может повлиять на промежуточный исход). В той мере, в какой точки принятия решений с отсутствующей информацией о пригодности состоят из случаев, которые должны были быть классифицированы как непригодные, если бы информация о пригодности была доступна, оценочный эффект интервенции может быть ослаблен по сравнению с оценочным эффектом при альтернативном возможном решении не рандомизировать точки принятия решений с отсутствующей информацией о пригодности.

В случае, когда точки принятия решений с отсутствующей информацией о пригодности рандомизируются, исследователи могут провести анализ чувствительности для оценки того, как решение рандомизировать эти точки принятия решений влияет на оценочный эффект интервенции. Это может быть сделано с помощью анализов модерации, где статус отсутствия информации о пригодности (то есть бинарная переменная, указывающая, что информация о пригодности наблюдаема против отсутствующей) тестируется как потенциальный модератор эффекта интервенции. Незначительный эффект взаимодействия предполагает, что может быть разумно рассматривать точки принятия решений с отсутствующей информацией о пригодности как пригодные. Однако, если наблюдается значительный эффект взаимодействия, это означает, что эффект интервенции варьировался между точками принятия решений с полной информацией о пригодности и теми, у кого она отсутствовала. Два сценария могут потребовать представления различных эффектов интервенции и должны рассматриваться отдельно в будущих JITAIs.

Импликации для дисперсии (точности)

Переменные для адаптации, ограничивающие рандомизацию (т.е. статус пригодности точек принятия решений), являются частью дизайна MRT; следовательно, то, как управляется отсутствие информации в этих переменных, может существенно изменить количество возможных точек данных, которые будут сгенерированы во время MRT. Естественно, это влияет на количество точек принятия решений (количество строк), которые могут быть использованы для оценки эффекта интервенции. Например, в MARS из общего числа возможных 4752 точек принятия решений 58% имели полную информацию о том, водили ли участники машину и был ли их телефон в режиме конфиденциальности (19% и 40% классифицированы как непригодные и пригодные соответственно), в то время как оставшиеся 42% имели пропущенные данные либо о вождении, либо о режиме конфиденциальности. Поскольку следователи MARS решили рассматривать точки принятия решений с отсутствующими данными о вождении или режиме конфиденциальности как пригодные, 40% + 42% точек принятия решений были рандомизированы для оценки эффекта интервенции. Как упоминалось ранее, другой вариант мог заключаться в рассмотрении точек принятия решений с отсутствующими данными о вождении или режиме конфиденциальности как непригодных для рандомизации. В этом случае количество случаев рандомизации, которые могли быть использованы для оценки эффекта интервенции, было бы сокращено вдвое (то есть рандомизировалось бы только 40% точек принятия решений). Учитывая эту большую разницу в количестве возможных точек данных, эффект интервенции, оцененный в первом дизайне (рандомизация при отсутствии информации о пригодности), скорее всего, будет иметь меньшую стандартную ошибку, чем оцененный во втором дизайне (не рандомизация при отсутствии информации о пригодности). Однако значения этих двух стандартных ошибок не следует напрямую сравнивать, поскольку смысл эффекта интервенции уже изменился при двух вариантах дизайна.

Будущие JITAIs на практике

Установление точки принятия решений как непригодной для рандомизации в MRT (например, из-за режима конфиденциальности телефона или вождения) означает, что исследователи уже решили, как действовать в этих случаях (например, не беспокоить участника), поэтому не требуется экспериментирование для ответа на вопросы о предоставлении вариантов интервенции в этих условиях. Таким образом, если MRT разработан таким образом, чтобы не рандомизировать точки принятия решений с отсутствующей информацией о пригодности, это означает, что будущая JITAI будет обрабатывать эти точки принятия решений так же, как они обрабатывались в MRT. С другой стороны, если MRT разработан так, чтобы рандомизировать точки принятия решений с отсутствующей информацией о пригодности, как в MARS, это означает, что все экспериментально протестированные варианты интервенции считаются осуществимыми при отсутствии информации о пригодности, и поэтому выбор того, какой вариант следует предоставить в будущей JITAI, зависит от результатов испытания. Например, путем исследования того, модерируется ли эффект интервенции отсутствием (по сравнению с полными) информацией о пригодности, исследователи могут определить, варьируется ли эффект интервенции между случаями с отсутствующей информацией о пригодности и случаями с полной информацией. Если результаты показывают, что предоставление подсказки неэффективно при отсутствии информации о пригодности, то будущая JITAI может воздержаться от предоставления подсказки в этих условиях.

Встроенные переменные для адаптации, которые не ограничивают рандомизацию

Априорные знания о переменных для адаптации также могут быть интегрированы в MRT без ограничения рандомизации. Например, на основе существующих данных и практических соображений содержание вариантов интервенции может быть адаптировано на основе текущего опыта и контекста человека. В этом случае обработка отсутствующих данных означает, что исследователи должны указать курс действий на случай отсутствия данных по встроенной переменной для адаптации (например, указать резервный вариант интервенции, который не зависит от входной информации от участников). В MARS самоотчеты участников о негативных эмоциях и наличии сигарет служили встроенными переменными для адаптации, которые не ограничивали рандомизацию (то есть самоотчет не использовался для принятия решения о предоставлении подсказки, а только для формулировки низкозатратных подсказок). Если участник сообщал о негативных эмоциях непосредственно перед определенной точкой принятия решений, подсказка, адаптированная к этому статусу, могла бы звучать так: «Когда вы чувствуете стресс, уйдите, если сигареты доступны, или выпейте стакан воды. Вы контролируете!» Однако, если участник не отвечал на вопросы о негативных эмоциях и наличии сигарет, вместо этого отправлялась подсказка общего содержания, такая как: «Гордитесь работой, которую вы делаете, чтобы изменить свою жизнь! Составьте список наград, которые вы можете дать себе за то, что остались трезвым».

Импликации для оценок (смещение)

Отсутствие данных во встроенных переменных для адаптации может иметь последствия для общей эффективности интервенции и, в свою очередь, привести к различным значениям и интерпретациям эффектов интервенции. В примере MARS низкозатратные подсказки, которые не были адаптированы, могли быть менее эффективными, чем адаптированные к эмоциям/контексту участника. Высокая доля отсутствующих данных о негативных эмоциях/наличии сигарет привела бы к более высокой доле неадаптированных подсказок (вместо адаптированных), которые предоставляются, что может ослабить эффект подсказок с низкозатратными стратегиями в поощрении участия в стратегиях саморегуляции. Следовательно, объем отсутствующих данных и стратегия обработки отсутствующих данных встроенных переменных для адаптации предоставляют важный контекст для интерпретации оценочного эффекта интервенции. Мы предлагаем исследователям протоколировать стратегию и сообщать процент отсутствующих данных, чтобы выводы могли быть четко интерпретированы и воспроизведены в будущих исследованиях.

Импликации для дисперсии (точности)

В отличие от других типов переменных MRT, отсутствие данных во встроенных переменных для адаптации, которые не ограничивают рандомизацию, не приводит к неполноте набора данных для анализов MRT. То есть, такая форма отсутствия данных не уменьшает количество точек принятия решений (строк), доступных для оценки эффектов интервенции. В примере MARS все 997 точек принятия решений, рандомизированных в условие низкозатратной подсказки, используются для оценки эффекта по намерению лечить подсказки с низкозатратными рекомендациями. Это верно, даже если 37% точек принятия решений (366/997) имели пропущенные значения в самоотчетах участников о негативных эмоциях и наличии сигарет, поскольку это отсутствие данных повлияло только на конкретное содержание отправляемых сообщений.

Будущие JITAIs на практике

Когда встроенные переменные для адаптации встроены в MRT, это означает, что исследователи планируют адаптировать будущую JITAI таким образом. План включает как способы вмешательства при наблюдении переменных для адаптации, так и способы действия в случае отсутствия переменных для адаптации. Тем не менее, прежде чем интегрировать такую запланированную адаптацию в оптимизированную JITAI, исследователи могут захотеть оценить, действительно ли адаптация варианта интервенции повышает эффективность варианта интервенции, как ожидалось, по сравнению с отсутствием адаптации. Один из способов исследовать это — изучить, модерирует ли отсутствие (по сравнению с полнотой) переменных для адаптации эффект интервенции (этот анализ является обсервационным, а не причинным). В примере MARS, если адаптация на основе текущих эмоций/контекста участников работала как предполагалось, адаптированные сообщения должны были дать более сильный эффект интервенции, чем неадаптированные сообщения. Если такая закономерность не наблюдается, это предполагает, что подсказки работают примерно одинаково без адаптации содержания, как и с ней. Возможно, адаптация содержания не была необходима или не была выполнена хорошо, и исследователям придется пересмотреть и усовершенствовать это использование переменных для адаптации. Важно отметить, что, поскольку решение об адаптации (по сравнению с отсутствием адаптации) в данном сценарии не рандомизируется, выводы этого анализа являются ассоциативными, а не причинными.

В сценарии, когда встроенные переменные для адаптации основаны на самоотчетах участников, как в MARS, возможно, что отсутствие данных представляет собой ситуацию, когда участник не полностью доступен для взаимодействия с запросами. Например, если участник слишком занят, отвлечен или устал, чтобы ответить на краткий опрос, предназначенный для адаптации подсказки (т.е. недоступен для сообщения о негативных эмоциях и наличии сигарет), то участник также, вероятно, не будет обращать особого внимания на саму подсказку (т.е. недоступен для взаимодействия с подсказкой через две минуты). По иронии судьбы, наблюдаемость или ненаблюдаемость определенной информации о состоянии участника может по-прежнему служить подсказкой для этого состояния, становясь своего рода косвенной информацией, а не отсутствующей информацией в классическом смысле (т.е. отсутствие негативных эмоций/наличия сигарет намекает на вероятность взаимодействия с подсказкой). В дизайне JITAI это означает, что отсутствующие данные о текущем состоянии/контексте участников могут по-прежнему быть ценными для эффективного определения времени предоставления вариантов интервенции.

Кандидаты для переменных адаптации для будущих JITAIs

Кандидаты для переменных адаптации — это измерения, собранные во время MRT о состоянии и контексте участника, которые исследователи рассматривают и исследуют их полезность в качестве переменных для адаптации в будущей JITAI. После завершения исследования эти переменные анализируются как возможные модераторы эффектов интервенции путем тестирования их взаимодействий со случайным назначением интервенции. Правдоподобными кандидатами обычно являются те, которые участвуют во взаимодействиях с перекрестным эффектом (crossover interactions), которые возникают, когда направление эффекта интервенции различается между уровнями модератора (Gunter et al., 2011). Например, если интервенция эффективна при определенных уровнях некоторой наблюдаемой переменной X и неэффективна или даже вредна при других уровнях, это будет очень информативно для предписания предоставления интервенции, предполагая включение переменной X в качестве переменной для адаптации в будущих JITAIs.

В MARS примерами кандидатов для переменных адаптации являются эмоциональные переживания (чувство стыда, вины, счастья и стресса), ментальная емкость (саморегуляция) и рискованное поведение (употребление никотина, марихуаны и алкоголя), операционализированные как измерения в предыдущей точке принятия решений. Для участников MARS EMA в предыдущей точке принятия решений представляют собой самую последнюю доступную информацию для характеристики их состояния в текущей точке принятия решений; конечно, исследователи могут рассматривать другие операционализации, такие как средние баллы по измерениям, собранным за последние 24 часа. Кроме того, другой дизайн MRT мог бы собирать информацию о кандидатах для переменных адаптации в EMA непосредственно перед рандомизацией в каждой точке принятия решений (для MARS это соответствует расширению двухвопросного опроса, проводимого за две минуты до каждой рандомизации). Этот подход устранил бы необходимость полагаться только на информацию, собранную в предыдущей точке принятия решений, которая может быть уже не актуальна для руководства предоставлением интервенции в текущей точке принятия решений, если точки принятия решений расположены далеко друг от друга. Однако недостатком является то, что добавление большего количества оценок увеличивает нагрузку на участников, что может увеличить процент отсутствия данных.

Импликации для оценок (смещение)

Отсутствие данных в кандидатах для переменных адаптации должно влиять только на исследовательские результаты в большинстве MRT, поскольку эти переменные изучаются как потенциальные модераторы эффектов интервенции, и такие анализы почти всегда специфицируются как исследовательские, а не как основные цели. Распространенный подход к обработке отсутствующих данных в этой ситуации по-прежнему заключается в анализе полных случаев. Исключение точек принятия решений с отсутствующими значениями в кандидатах для переменных адаптации может привести к отклонению состава аналитической выборки от состава выборки, прошедшей набор, и, в свою очередь, внести смещение в оценочные эффекты взаимодействия (где «смещение» означает отклонение от оценок, которые были бы получены с использованием полной выборки, прошедшей набор, с полными данными). Например, если потенциальный модератор определяется как измерение в предыдущей точке принятия решений, то оценочный эффект взаимодействия, как правило, основывается больше на данных от лиц, которые участвуют непрерывно, и меньше — на данных от лиц, которые участвуют прерывисто. В крайнем сценарии анализ будет включать все данные от человека, который участвует в течение одного дня, а затем выбывает из исследования, но исключит все данные от другого человека, который участвует в каждой второй точке принятия решений. В той степени, в какой эффект интервенции варьируется между участниками, участвующими по разным графикам, отсутствующие данные по этому потенциальному модератору могут внести смещение в результаты модели.

Импликации для дисперсии (точности)

Отсутствие данных в кандидатах для переменных адаптации уменьшает количество точек принятия решений, доступных для анализа, и, следовательно, влияет на точность оценочных эффектов взаимодействия. Для списка потенциальных модераторов, проанализированных в MARS, в среднем 28% точек принятия решений содержали пропущенные значения (из 2523 точек принятия решений, которые были рандомизированы и имели непропущенное значение по основному промежуточному исходу). Рисунок 3 показывает, как аналитическая выборка анализов модерации накопила множественные источники отсутствия данных. Уменьшенная выборка влияет на точность оценочных эффектов взаимодействия.

Изменения в количестве точек принятия решений, доступных для анализа, из-за различных источников отсутствующих данных.
Рисунок 3. Изменения в количестве точек принятия решений, доступных для анализа, из-за различных источников отсутствующих данных. Эти изменения в размере выборки влияют как на смещение, так и на точность оценочных эффектов интервенции.

Будущие JITAIs на практике

Если кандидат для переменной адаптации содержит отсутствующие данные во время MRT, возможно, что эта переменная будет содержать примерно такое же количество отсутствующих данных, когда она будет использоваться в качестве переменной для адаптации в будущем развертывании оптимизированной JITAI. Использование текущего MRT для информирования о том, как вмешиваться при отсутствии переменных для адаптации, может быть столь же важным, как и выявление хороших переменных для адаптации и определение того, как вмешиваться при наличии переменных для адаптации. К сожалению, результаты модерации при анализе полных случаев, исключающем точки принятия решений с отсутствующими значениями в кандидате для переменной адаптации, не генерируют эмпирических знаний о том, как лучше всего вмешаться при отсутствии переменных для адаптации. Например, предположим, что недавнее употребление никотина участниками (например, участники сообщали о недавнем курении сигарет) модерирует эффект интервенции; то есть подсказка увеличивает вовлеченность в саморегуляцию при наличии употребления никотина участниками, но имеет минимальный эффект при отсутствии употребления. Если бы JITAI была разработана на основе этого результата, подсказки, вероятно, должны были бы доставляться только в точках принятия решений, когда участники сообщают о недавнем употреблении никотина, но не в точках принятия решений, когда они сообщают об отсутствии недавнего употребления. Однако такие выводы не информируют о том, как действовать при отсутствии информации о недавнем употреблении никотина участниками.

Мы предлагаем расширить анализ модерации, кодируя статус отсутствия употребления никотина как отдельную категорию и моделируя его как вторую модератор для эффекта подсказки. Это позволяет оценить эффект подсказки отдельно для трех сценариев:

  • (а) Когда участники сообщают о недавнем употреблении никотина.
  • (б) Когда они сообщают об отсутствии недавнего употребления никотина.
  • (в) Когда они не отвечают на вопрос.

Анализ, подобный этому, будет направлять будущие JITAIs в использовании наблюдаемых значений, а также статуса отсутствия данных, переменных для адаптации для настройки доставки интервенции. Как упоминалось выше, неспособность или отказ ответить на вопрос — это не просто отсутствие определенной информации о состоянии участника, но и потенциальный показатель полезной информации о состоянии сам по себе (например, указывающий на то, что участник может быть занят или не заинтересован).

Множественная импутация в MRT

В этом разделе мы обсуждаем проблемы, связанные с множественной импутацией (Multiple Imputation, MI) в MRT, и почему мы считаем, что она может быть не всегда подходящей в контексте MRT. Множественная импутация — это популярный метод для учета отсутствующих данных при статистических выводах (Rubin, 2004; Schafer & Graham, 2002; Van Buuren, 2018). Распространенные реализации этого метода основаны на предположении, что механизм отсутствия данных является «случайным» (missing at random, MAR) (Rubin, 2004; Schafer & Graham, 2002; Van Buuren, 2018); то есть вероятность отсутствия данных связана с наблюдаемыми переменными. При условии, что это предположение выполняется и модель импутации правильно специфицирована, множественная импутация устраняет смещения, вызванные отсутствующими данными, эффективно использует доступные данные и корректно корректирует стандартные ошибки для учета увеличенной дисперсии из-за неопределенности импутации.

Однако на сегодняшний день нет устоявшихся лучших практик для проведения множественной импутации для различных типов переменных, собираемых в MRT. Методологические исследования вариантов множественной импутации для продольных данных продолжаются (см. Wijesuriya et al., 2025), и будущая работа может показать, как адаптировать один из этих методов к анализам MRT. Процесс разработки моделей импутации для MRT сложен по нескольким причинам. Первая проблема возникает из-за интенсивной продольной структуры данных MRT. Один подход к импутации, который следует логике множественной импутации для рандомизированных испытаний с последовательным множественным назначением (sequential multiple assignment randomized trials), предполагает, что отсутствующие значения в момент времени t должны предсказываться с использованием всех данных с момента времени 1, 2, ots , t-1, и t, но не данных с момента времени t+1 или позже. Для каждой из многочисленных точек принятия решений в MRT необходимо строить отдельные модели импутации, используя данные до этого момента.

Другая проблема возникает из-за ограниченных рандомизаций. В MARS измерение промежуточного исхода проводилось только в точках принятия решений, пригодных для рандомизации. Теперь предположим, что аналитик хочет использовать промежуточный исход в предыдущей точке принятия решений (Y_{t-1}) для импутации отсутствующих значений промежуточного исхода в текущей точке принятия решений (Y_t). Эта модель имеет смысл только для участников, которые пригодны для рандомизации и могут логически иметь непропущенное значение как в момент времени t, так и в t-1. Для участников, непригодных в момент времени t-1, у них нет и не должно быть значения Y_{t-1}; следовательно, для импутации Y_t требуется другая модель импутации, которая не использует Y_{t-1} в качестве предиктора. Другими словами, ограниченная рандомизация приводит к запланированному отсутствию данных в MRT, что усложняет моделирование импутации.

Оставляя в стороне технические проблемы, в данной статье мы предполагаем, что методы, основанные на импутации, могут быть не подходящими для решения всех источников отсутствующих данных в MRT для всех аналитических целей. Импутация отсутствующих значений может не соответствовать тому, как переменные будут использоваться при принятии решений о том, как и когда вмешиваться в будущих JITAIs. Например, рассмотрим кандидатов для переменных адаптации, которые оцениваются как потенциальные модераторы эффектов интервенции. Цель анализа модерации — получить результаты, которые могут быть использованы для разработки практически реализуемых правил принятия решений JITAI. Множественная импутация отсутствующих значений в кандидате для переменной адаптации для анализа модерации может не отражать, как эта переменная будет использоваться на практике, поскольку будущая JITAI, вероятно, не будет выполнять импутацию отсутствующих значений в переменных для адаптации в реальном времени. JITAI, вероятно, потребуется отдельное правило «если переменная для адаптации отсутствует, то…», чтобы предоставить интервенцию в моменты, когда контекстная информация об участниках недоступна. Для разработки этого правила требуются эмпирические знания о том, какая интервенция является наиболее эффективной при отсутствии переменных для адаптации. Это требует, чтобы анализ модерации рассматривал отсутствие данных в кандидате для переменной адаптации как отдельную категорию и моделировал его как отдельный модератор.

Таким образом, хотя мы считаем, что для будущих методологических исследований важно предоставить эмпирически обоснованные и стандартизированные рекомендации по проведению множественной импутации в MRT с различными дизайнами, мы также полагаем, что множественная импутация не всегда необходима или является лучшим подходом для обработки отсутствующих данных в MRT. При рассмотрении внедрения JITAIs на практике отсутствующие данные об участниках могут представлять реальную, практическую и значимую ситуацию, которую должна учитывать адаптированная интервенция. Соответственно, рассмотрение отсутствующей информации как отдельной категории в анализах MRT может предоставить ценную информацию для разработки правил принятия решений JITAI именно потому, что возникновение отсутствия данных не является случайным.

Будущие исследования

Часто говорят, что лучший подход к обработке отсутствующих данных — это их избегать (Little et al., 2012). Необходимы дальнейшие исследования для разработки стратегий удержания участников и сокращения отсутствующих данных за счет дизайна исследования (NahumShani, Rabbi et al., 2021b; Rabbi et al., 2018). Заимствуя идеи из методологии опросов, существует множество соображений, касающихся использования стимулов (Dillman et al., 2014; Mercer et al., 2015; Singer & Ye, 2013). Например, предоставление небольшого предоплаченного стимула может быть более эффективным для поощрения завершения, чем обещание обусловленного стимула, потому что это больше не оплата, компенсирующая время и усилия участников, а знак признательности, вызывающий чувство взаимности (Dillman et al., 2014; Mercer et al., 2015; Singer & Ye, 2013). Разработка эффективных и действенных способов стимулирования участников MRT может быть решающей для поощрения завершения исследовательских оценок. Однако следует проводить различие между исследовательским аспектом MRT и интервенциями, встроенными в испытание, поскольку стратегии сокращения отсутствующих данных могут отличаться в двух контекстах. Например, если EMA проводятся только для сбора исследовательских исходов для оценки эффективности вариантов интервенции, то использование моментальных стимулов может быть простым способом поощрения участников к завершению исследований. Однако, если EMA также собирают информацию, которая используется в качестве переменных для адаптации для интервенции (например, самоотчет о стрессе для адаптации содержания сообщений), то стимулирование участников может больше не быть практичным и масштабируемым при развертывании интервенции в реальном мире.

Другой областью для будущих исследований является проведение последующих мероприятий по реагированию на неответы для дополнения данных, собранных с помощью EMA. Было проведено обширное исследование полезности проведения дополнительных последующих оценок, нацеленных на участников, которых трудно набрать с помощью первоначального протокола сбора данных (Couper et al., 2007; Goldberg & Sciarini, 2019; Helakorpi et al., 2015; Peytchev et al., 2009). В этом аспекте, для понимания механизма отсутствия данных и последствий для результатов исследования, необходимо собирать дополнительные данные в случаях, которые изначально отсутствовали. Один из способов сделать это — пригласить участников заполнить ретроспективные опросы (например, в конце дня) о предыдущих моментах, когда проводились EMA. Сравнение ретроспективных данных с наблюдаемыми данными EMA прольет свет на механизм отсутствия данных в EMA. Такие данные также могут быть использованы для подгонки моделей импутации для исправления потенциальных смещений в оценочных эффектах интервенции, вызванных отсутствующими данными. Кроме того, в конце испытания могут быть проведены качественные интервью с участниками, чтобы изучить моменты, когда они не сообщают о своем поведении и состоянии. Такие качественные данные могут помочь исследователям определить причины отсутствия данных и найти наилучшие способы вмешательства, когда информация в реальном времени о состоянии участников недоступна.

Как учитывать предполагаемое отсутствие данных при планировании размера выборки, также является важной областью для будущих исследований. Чтобы сохранить определенный уровень мощности, несмотря на отсутствие данных, один интуитивно понятный подход заключается в расчете необходимого размера выборки без учета отсутствующих данных, а затем увеличении размера в соответствии с ожидаемой долей отсутствующих данных. Это просто, но имеет недостаток рассмотрения доли отсутствующих данных как одинаковой на протяжении всего исследования. Неучет возможных временных закономерностей в отсутствующих данных может привести к тому, что оценочный размер выборки будет меньше или больше, чем фактически необходимо. Альтернативно, для учета временной закономерности отсутствующих данных исследователи могут использовать входной параметр «ожидаемая доступность» (называемый «пригодностью» в вышеизложенном обсуждении) в калькуляторах размера выборки, специфичных для MRT (Liao et al., 2016; Seewald et al., 2016). В частности, параметр «ожидаемая доступность» может рассматриваться как составной, включающий как ожидаемую частоту доступности, так и предполагаемую частоту отсутствия данных. Поскольку этот параметр может быть задан как изменяющийся во времени, он предоставляет практическое решение для учета изменений в частоте отсутствия данных в ходе исследования. Однако этот подход может быть ограничен, если закономерность отсутствия данных отличается от закономерности непригодности и не может быть легко объединена в одну составную тенденцию. Кроме того, этот подход неявно изменяет оценку с «среднего промежуточного эффекта лечения, когда участники пригодны» на «средний промежуточный эффект лечения, когда участники пригодны и предоставляют данные для оценки этого эффекта;» последний является запутанным для интерпретации, особенно для целей информирования об оптимизации интервенции. В целом, мы предполагаем, что выбор между этими подходами зависит от предположений о продольной закономерности отсутствия данных (например, возрастающей или постоянной частоте отсутствия данных). Необходимы дальнейшие исследования для разработки эффективных и простых в использовании подходов к включению различных источников отсутствующих данных в планирование размера выборки, а также к упрощению необходимости ввода параметров от содержательных исследователей.

В данной статье мы сосредоточены на использовании MRT для ответа на вопросы о том, как лучше всего конструировать JITAIs. Однако MRT также могут быть использованы для ответа на вопросы о том, как лучше всего конструировать персонализированные JITAIs (pJITAIs) — развивающийся дизайн интервенции, в котором правила принятия решений, управляющие JITAI, оптимизируются по мере того, как индивид переживает интервенцию в реальном времени. В частности, pJITAIs используют алгоритмы обучения с подкреплением (reinforcement learning, RL) для обновления правил принятия решений JITAI на основе информации, полученной во время интервенции, об отзывчивости человека и его вовлеченности в варианты интервенции (Coughlin et al., 2024; NahumShani & Murphy, In Press; NahumShani et al., 2024). Управление отсутствующими данными в этих условиях более сложно и может потребовать дополнительных методологических соображений.

В целом, концепция и использование термина «отсутствующие данные» также должны быть уточнены и расширены, чтобы отразить нюансы их значения. Эти нюансы включают, что отсутствует, почему отсутствует и как отсутствие связано с конкретными исследовательскими вопросами или практическими соображениями. Последствия и управление отсутствующими данными зависят от этих вопросов. В статистической литературе отсутствующие данные часто обсуждаются в рамках теоретического предположения о том, что истинное значение существует в суперпопуляции, но не наблюдается; цель анализа — сделать выводы, используя неполные данные, стремясь аппроксимировать оценку так, как если бы отсутствующих значений не было (Schafer & Graham, 2002). Однако это предположение не применимо ко всем формам отсутствия данных. Например, отсутствующие данные иногда могут означать, что не существует определимого истинного значения (например, никотиновый статус супруга у лиц без супруга), и набор данных, несмотря на пустые ячейки, на самом деле является полным (Dziak & Henry, 2017). Кроме того, если цель состоит в том, чтобы информировать реальную практику, где отсутствующая информация является частью реальности, может быть неуместно делать предположения об истинных ненаблюдаемых значениях в суперпопуляциях. Вместо этого отсутствие данных должно рассматриваться как отдельная и значимая категория, где «нет ответа» может служить подразумеваемым или частичным ответом.

Заключение

Данная статья описывает различные источники и отличительные последствия отсутствующих данных в MRT, которые важны для исследований MRT по трем ключевым причинам. Во-первых, разнообразные модальности и сроки сбора данных создают множественные источники отсутствующих данных, что отличает MRT от обсервационных исследований и стандартных РКИ. Наша цель — помочь будущим исследователям лучше предвидеть и планировать эти множественные источники отсутствия данных, чтобы они могли получить более качественные данные для решения своих научных вопросов. Во-вторых, отсутствие данных в MRT влияет на статистические выводы не только путем создания неполноты аналитического набора данных в классическом смысле, но и путем изменения интервенции и дизайна испытания. Описание последствий отсутствующих данных поможет исследователям принимать более обоснованные решения о том, как минимизировать отсутствующие данные, обрабатывать отсутствующие данные и интерпретировать последующие выводы. В-третьих, определенные типы отсутствующих данных в MRT должны управляться с пониманием того, что отсутствие данных будет неизбежным аспектом будущих JITAIs. Следовательно, цель анализа MRT не всегда заключается в восстановлении отсутствующих значений или аппроксимации статистических выводов так, как если бы отсутствующих значений не было. Во многих ситуациях отсутствие данных может быть концептуализировано как самостоятельное, отдельное состояние, на основе которого на практике должно приниматься решение об интервенции.

Наше обсуждение показывает, что управление отсутствием данных в различных переменных MRT может привести к изменениям в интервенции, изменениям в научных вопросах об интервенции и изменениям в методе оценки этих вопросов. Не обязательно существует правильный или неправильный подход к различным источникам отсутствующих данных в MRT, но будущие исследования выиграют от осведомленности об этих нюансах и продуманного рассмотрения отсутствующих данных при проектировании MRT. Последствия этих выборов распространяются на интерпретацию и точность результатов MRT, а также на будущие JITAIs, которые будут разработаны на основе выводов MRT.

Короткие версии статей можно найти в телеграм-канале.

Посмотреть канал
Кликните еще раз для перехода

Эфирное масло мускатного шалфея 10 мл — ароматерапия

Эфирное масло мускатного шалфея 10 мл — натуральный продукт для ароматерапии, релаксации и ухода за ...

Курносики Мишутка прищепка для пустышки с цепочкой

Курносики Мишутка прищепка для пустышки с цепочкой — идеальный аксессуар для малышей, который обеспе...

Хило-Комод 10 мл – увлажнение и защита глаз

Хило-Комод офтальмологический увлажняющий раствор с гиалуроновой кислотой и гепарином обеспечивает и...

Ночной крем Виши Лифтактив Супрем от морщин | Аптека

Ночной крем Виши Лифтактив Супрем для лица интенсивно борется с морщинами во время сна. Подходит для...

Мелиссы трава фильтр-пакеты 1,5г №20 - купить в аптеке

Натуральный фитопрепарат из травы мелиссы лекарственной с комплексным действием. Оказывает успокаива...

Релаксан компрессионные колготки для беременных 140 Den – ку...

Релаксан Компрессионные колготки для беременных 140 Den эффективно поддерживают ноги, уменьшая отёки...