Мета-анализ отношения шансов: современные передовые практики

Мета-анализ отношения шансов: современные передовые практики Многие систематические обзоры рандомизированных клинических испытаний приводят к метаанализу отношения шансов. Обычные методы оценки общей

Многие систематические обзоры рандомизированных клинических исследований приводят к метаанализу отношения шансов. Обычные методы оценки общего отношения шансов включают средневзвешенные оценки логарифма отношения шансов в отдельных испытаниях. Однако у этого подхода есть несколько недостатков, связанных с предположениями и приближениями, которые делают результаты ненадежными. Хотя проблемы описаны в литературе в течение многих лет, традиционные методы все еще используются в программном обеспечении и приложениях. Хорошо разработанный альтернативный подход позволяет избежать аппроксимации, работая напрямую с количеством субъектов и событий в группах отдельных испытаний.

Задача

Мы стремимся повысить осведомленность о методах, которые избегают обычных приближений, могут применяться с широко доступным программным обеспечением и давать более надежные результаты.

Методы

Мы резюмируем подходы к метаанализу с фиксированными и случайными эффектами; описывать общепринятые, приблизительные методы и альтернативные методы; применять методы в метаанализе 19 рандомизированных исследований эндоскопической склеротерапии у пациентов с циррозом печени и варикозным расширением вен пищевода; и сравните результаты. Мы демонстрируем использование программного обеспечения SAS, Stata и R.

Результаты

В этом примере точечные оценки и доверительные интервалы для общего логарифмического отношения шансов различаются между традиционными и альтернативными методами, что может повлиять на выводы. Программирование осуществляется с помощью трех программных пакетов; приложение дает подробности.

Выводы

Требуемое скромное дополнительное программирование не должно быть препятствием для принятия альтернативных методов. Поскольку их результаты ненадежны, следует прекратить использование традиционных методов метаанализа отношений шансов.

Вступление

Многие дисциплины обобщают данные по вопросам исследования, которые могут быть сформулированы в виде числовой меры воздействия вмешательства (например, частота инфаркта миокарда [ИМ] при сравнении лекарств). Процесс обобщения доказательств включает в себя конкретизацию вопроса, поиск всех исследований, в которых представлены соответствующие доказательства, сохранение тех, которые имеют адекватное качество, извлечение представленных ими данных о фокусном эффекте и, наконец, анализ этих данных для оценки имеющихся доказательств по исследованию. вопрос. 1 Термин «метаанализ» иногда применяется ко всему процессу исследовательского синтеза. Однако чаще это относится к статистическому анализу собранных данных. Одна из целей метаанализа - оценить общий эффект вмешательства путем объединения данных отдельных исследований.Эта статья посвящена исключительно рандомизированным контролируемым испытаниям (РКИ).

Часто данные об эффекте вмешательства представляют собой частоту событий (например, ИМ или смерть) в группе вмешательства и в контрольной группе каждого исследования (Таблица 1). Среди мер воздействия, рассчитанных на основе этих данных о частоте, возможно, наиболее распространенным является отношение шансов (OR = ad / bc ). В метаанализе использовались различные статистические методы для оценки общего эффекта, который суммирует размеры эффекта из отдельных исследований. Большинство этих методов включают приближения, основанные на предположении, что каждое исследование имеет большой размер выборки, но фактические размеры выборки часто невелики. Были разработаны альтернативные методы, в которых эти приближения не используются.

Таблица 1

Частоты события (и отсутствия события) в двух группах исследования

Группа интервенции Контрольная группа
Событиеаб
Нет событияcd
п яп С

a, b, c, d: частота в ячейке

Используя набор данных из литературы, эта статья демонстрирует использование одного альтернативного метода и традиционных методов (для сравнения), когда доступные данные представляют собой количество событий и количество субъектов в каждой группе каждого РКИ. Мы покажем, как проводить анализ в SAS, Stata и R. В следующих разделах мы

представить пример, включающий 19 рандомизированных испытаний, в которых изучалась эндоскопическая склеротерапия для предотвращения первого кровотечения и снижения смертности у пациентов с циррозом печени и варикозным расширением вен пищевода и желудка;

кратко рассмотрим две основные категории подходов к моделированию (модели с фиксированными эффектами и модели со случайными эффектами) в метаанализе;

обсудить традиционные статистические методы, которые используют отношения шансов на уровне исследования (и, следовательно, предполагают, что отдельные исследования имеют большие выборки) для оценки общего эффекта;

обсудить установленный альтернативный статистический метод, который напрямую использует количество событий в исследованиях и количество субъектов для оценки общего эффекта;

применять как традиционные методы, так и альтернативный метод к данным исследований склеротерапии;

описать программирование альтернативного статистического метода в SAS, Stata и R, уделяя внимание выбору параметров, отличных от значений по умолчанию для некоторых команд; и

предоставить рекомендации и некоторые заключительные обсуждения.

Методы

Пример

Чтобы конкретизировать детали подходов, мы используем данные Pagliaro et al. 2, которые использовали мета-анализ для оценки эффективности эндоскопической склеротерапии в предотвращении первого кровотечения и снижении смертности у пациентов с циррозом и варикозным расширением вен пищевода. Данные были получены из 19 рандомизированных исследований. Для экспериментальной и контрольной групп в каждом испытании в таблице 2 указано общее количество субъектов, число смертей и число субъектов с кровотечением. Количество испытаний (19) умеренное. Количество субъектов в каждой из групп в этих испытаниях также невелико. За исключением 143 в одном испытании, число в группе лечения колеблется от 13 до 73; соответствующие числа в контрольной группе - 138 и от 16 до 72. В двух исследованиях в одной из групп не было событий.Ряд других авторов использовали эти данные в примерах, в том числе Хиггинс и Уайтхед, 3 Томпсон и др., 4 Томпсон и Шарп, 5 Уайтхед, 6 Лу и Адес, 7 и Симмондс и Хиггинс. 8

Таблица 2

Данные о смертях и пациентах с кровотечениями в 19 исследованиях склеротерапии у пациентов с циррозом печени и варикозным расширением вен пищевода и желудка

ID пробной версии Всего предметов Количество смертей Количество кровотечений Контроль Вмешательство Контроль Вмешательство Контроль Вмешательство
13635 год142223
253562912305
318166665
422236493
54649343031 год11
660531413919
76053271526 год17
8697126 год162910
941 год41 год19101412
102021 год2030
1141 год421818139
1235 год3321 год201413
1313814323462331 год
14515524191920
15727314181313
16161342123
1728 год21 год8653
1819186704
1924225526

Статистические методы

1. Подходы: фиксированный эффект и случайные эффекты

Подходы к метаанализу обычно делятся на две категории в соответствии с их предположениями об эффектах на уровне исследования. Методы фиксированного эффекта предполагают, что в основе всех исследований лежит единый общий эффект и что наблюдаемые эффекты на уровне исследования отличаются от этого истинного эффекта только из-за вариации выборки в каждом исследовании. Это предположение может быть уместным, если исследования по существу имеют одинаковый дизайн, вмешательство, популяцию пациентов и критерии результатов. Однако обычно дизайн, характеристики пациентов и детали вмешательства различаются в разных исследованиях; и более реалистично учесть вариации в истинных эффектах, рассматривая их как происходящие из распределения эффектов на уровне исследования. Таким образом,Методы случайных эффектов сосредоточены на оценке среднего значения этого распределения, а также дисперсии распределения (как обобщения неоднородности эффектов на уровне исследования).

2. Обычные методы, использующие величину эффекта на уровне исследования.

Когда результат для каждого субъекта является бинарным, общие методы метаанализа (как модели с фиксированным эффектом, так и модели со случайными эффектами) используют логарифм OR в качестве величины эффекта в каждом исследовании вместе с оценкой его дисперсии (обычно 1 а + 1 б + 1 в + 1 г). Предполагается, что эти оценочные отклонения равны истинным отклонениям. На практике это предположение делается регулярно, независимо от размеров выборки, в результате чего результаты метаанализа могут быть ненадежными. Технически формула 1 a + 1 b + 1 c + 1 d не может быть правильной: всякий раз, когда любой из a , b , c и dимеет положительную вероятность быть 0, истинная дисперсия log (OR) не конечна. Формула соответствует дисперсии нормального распределения, к которому распределение log (OR) приближается, когда n I и n C становятся большими. Добавление положительной константы к счетчику в каждой ячейке позволяет избежать не конечной дисперсии, но вряд ли имеется какое-либо эмпирическое свидетельство того, насколько близко распределение модифицированного журнала (OR) напоминает нормальное распределение.

Чтобы более конкретно описать традиционные методы для моделей с фиксированными эффектами и случайными эффектами, мы обозначаем предполагаемый эффект из Исследования i (например, логарифм (OR)) через y i, а его оценочную дисперсию через si 2 ( i = 1, … k ). Обычная модель фиксированного эффекта связывает y i с общим эффектом μ :

где e i имеет (по крайней мере приблизительно) нормальное распределение со средним значением 0 и дисперсией σ i 2. То есть, за исключением вариации выборки в рамках исследований, каждый y i является оценкой μ . Такие ситуации редко возникают на практике, поэтому модель случайных эффектов позволяет варьировать μ в разных исследованиях:

где μ i взяты из распределения со средним μ и дисперсией τ 2. (Некоторые методы дополнительно предполагают нормальное распределение для μ i .)

Обычная оценка общего эффекта μ с фиксированным эффектом представляет собой средневзвешенное значение с wi = 1 / si 2:

Обычно дисперсию ȳ w оценивают как 1 / Σ w i , но этот подход в значительной степени опирается на предположение, что si 2 является истинной дисперсией y i (которое мы обозначим через σ i 2), или предположение, что число предметов в каждой группе велика.

В традиционной модели случайных эффектов каждый наблюдаемый эффект на уровне исследования имеет два источника вариации: в рамках исследования (σ i 2) и между исследованиями ( τ 2). То есть var (yi) = σ i 2 + τ 2. Обычная оценка случайных эффектов μ представляет собой средневзвешенное значение с весами, отражающими оба источника вариации, wi ∗ = 1 / (si 2 + τ ^ 2):

Оценка т 2, обозначим через т 2, выводится из Y я и Si 2. Обычная оценка дисперсии y ¯ w ∗ равна 1 / ∑ wi ∗. Как и в методе фиксированного эффекта, он заменяет неизвестное σ i 2 на si 2. Другим потенциальным источником осложнений является использование т 2 , как если бы это было истинное значение, т 2 (т.е. без резерва по изменчивости т 2).

Обобщенный выше подход со случайными эффектами является основой процедуры, описанной Дерсимониан и Лэрд. 9 Они получают оценку τ 2, используя метод моментов: полагая Q = Σ w i ( y i - ȳ w ) 2 равным выражению для его ожидаемого значения, и решая, чтобы произвести

(максимальная операция позволяет избежать негативных оценок между исследованиями дисперсии, но τ 2 = 0 все еще возможно, то Wi = Wi * и у ¯ W * = у ¯ ш). К сожалению, при получении ожидаемого значения Q предполагается, что si 2 = σ i 2. В ряде исследований с использованием обширного моделирования было обнаружено, что результирующий 1 / ∑ wi ∗ имеет тенденцию занижать дисперсию y ¯ w ∗ и приводит к доверительным интервалам (основанным на нормальном распределении), которые имеют охват ниже номинального (например, на уровне 95%) от μ . 10–12 Кроме того, в некоторых исследованиях было обнаружено существенное смещение в y ¯ w ∗ как оценке μ. 11,13 Несмотря на эти недостатки, процедура DerSimonian-Laird (DL) является методом по умолчанию во многих программах для метаанализа. Мы обсудим программное обеспечение более подробно ниже.

Были разработаны методы устранения недостатков метода DL. Для оценки дисперсии y ¯ w ∗ Хартунг и Кнапп и отдельно Сидик и Йонкман разработали альтернативный метод (метод HKSJ). Было показано, что доверительный интервал HKSJ работает лучше, чем DL, даже когда количество исследований невелико, а размеры выборки не равны. 12 Однако метод HKSJ использует ту же оценку μ, что и DL.

Харди и Томпсон 14 предложили метод профильного правдоподобия для оценки μ и τ 2, а также 95% доверительный интервал для τ 2. Предполагая нормальное распределение для каждого y i и нормальное распределение (со средним μ и дисперсией τ 2) для случайных эффектов, они получают оценки совместного правдоподобия и, таким образом, максимального правдоподобия для μ и τ 2. Они используют профили поверхности правдоподобия для определения 95% доверительного интервала (ДИ) для μ и 95% доверительного интервала для τ.2, каждый из которых отражает тот факт, что оценивается другой параметр. Кроме того, эти КЭ не должны быть симметричными относительно точечных оценок. В отношении этих благоприятных свойств необходимо учитывать, что si 2 (которые обычно являются только приблизительными) все еще используются, как если бы они были σ i 2, и что нормальное распределение для каждого y i является сильным предположением, особенно когда y равно log (OR ).

Для log (OR) и некоторых других мер воздействия все эти традиционные методы не принимают во внимание корреляцию между y i и si 2, что нарушает одно из их предположений (что в модели случайных эффектов μ i и e i независимы). Из приведенных ранее выражений логарифм (ИЛИ) и его оценочная дисперсия являются функциями a , b , c и d . Тан показывает математически и графически взаимосвязь между основным риском в группе лечения и весом фиксированного эффекта исследования (т. Е. Обратной величиной si 2). 15

3. Альтернативные методы с использованием количества событий и количества субъектов в каждой группе.

Когда количество событий (и размеры выборки) в интервенционной и контрольной группах могут быть извлечены для каждого исследования, метаанализ может использовать эти данные напрямую и избежать трудностей, связанных с использованием журнала выборки (ИЛИ) исследований. и его предполагаемая дисперсия. 8 Если n Ii обозначает размер выборки в интервенционной группе исследования i, а p Ii обозначает вероятность события для человека в этой группе, анализ моделирует количество событий x Ii как наблюдение из корзины биномиального распределения. ( n Ii , p Ii ). Аналогично количество событий в контрольной группе x Ci, моделируется как наблюдение из бункера ( n Ci , p Ci ).

Для метаанализа с фиксированным эффектом простая модель логистической регрессии использует логит-преобразование, logit ( p ) = log e [ p / (1− p )], чтобы связать биномиальные вероятности с эффектами:

Здесь g i - логарифм-шансы для контрольной группы в исследовании i , а μ - общее (то есть общее) логарифмическое отношение шансов. Данные вводятся через биномиальные вероятности для x Ci и x Ii . Этот подход включает возможность того, что одно или несколько подсчетов ячеек в таблице 1 равны 0.

Тернер и др. 16 подходят к соответствующему метаанализу случайных эффектов как к многоуровневой модели (типу обобщенной линейной смешанной модели); двумя уровнями являются вариабельность внутри исследования и вариабельность между исследованиями. Когда мерой воздействия является логарифм (OR), результат также известен как модель логистической регрессии со смешанными эффектами:

(как и в модели с фиксированным эффектом, g i являются мешающими параметрами). Stijnen et al. изучить подходы к метаанализу случайных эффектов результатов событий и обсудить недостатки традиционного подхода. 17

Подход с использованием обобщенной линейной смешанной модели нелегко распространить на логарифм отношения ставок, log (RR) = log ( p I ) - log ( p C ), или на разницу рисков (RD), p I - р С . Сложности возникают из-за того, что расчеты должны обеспечивать, чтобы расчетные значения p I и p C оставались в пределах от 0 до 1. Исследования альтернативных подходов продолжаются.

Можно также рассмотреть байесовский подход к метаанализу, как описано, например, Dias et al. 18 Для логарифма (OR) байесовский анализ использует ту же базовую модель, что и логистическая регрессия со смешанными эффектами. Это также требует априорных распределений для μ и τ 2 (или τ ). Затем вычисления методом Монте-Карло с цепью Маркова дают целые апостериорные распределения для μ , τ 2 и других величин. В настоящее время байесовский анализ требует специализированного (но свободно доступного) программного обеспечения и большего объема программирования, чем логистическая регрессия со смешанными эффектами. Помощь статистика, имеющего опыт работы с байесовским метаанализом, вероятно, будет существенной.

Программного обеспечения

Мета-анализ с фиксированными и случайными эффектами, основанный на журнале выборки на уровне исследования (OR) и si 2, доступен в ряде программных сред, в том числе в Диспетчере обзоров Кокрановского сотрудничества (RevMan, tech.cochrane.org) и Пользовательские команды Stata metan и metaan. 19 Для метаанализа случайных эффектов процедура DerSimonian-Laird часто используется по умолчанию (как в RevMan) или является единственным вариантом. Ввиду документально подтвержденных недостатков DL такая ситуация вызывает сожаление. Метод профильного правдоподобия - это опция для метаана команды в Stata. Чтобы проанализировать пример набора данных с помощью обычного подхода, мы использовали метан и метан в Stata, чтобы подогнать под модель фиксированного эффекта методом взвешенного среднего и подобрать модель случайных эффектов с помощью методов DL и профильного правдоподобия. Эти две команды добавляют 0.5 ко всем четырем ячейкам для исследования, если хотя бы одна ячейка равна 0.

Для работы непосредственно с количеством событий и размерами выборки в двух группах исследований в метаанализе с фиксированным эффектом можно использовать обычное программное обеспечение для логистической регрессии (большинство программ принимает либо биномиальные данные, либо отдельные двоичные данные). Однако метаанализ случайных эффектов, основанный на модели логистической регрессии со смешанными эффектами, требует более сложного программного обеспечения, поскольку оценка включает интеграцию случайного эффекта ( u i). Текущее программное обеспечение выполняет численное интегрирование с использованием нескольких методов аппроксимации, включая аппроксимацию Лапласа и адаптивную квадратуру Гаусса-Эрмита, и предлагает опытным пользователям множество вариантов управления процессом. Поскольку программное обеспечение разработано для соответствия многим типам моделей логистической регрессии со смешанными эффектами, параметры по умолчанию могут быть неудовлетворительными для метаанализа. Таким образом, мы предлагаем советы по выражению метаанализа случайных эффектов в виде моделей логистической регрессии со смешанными эффектами в нескольких программных средах и по выбору подходящих вариантов.

Мы используем программные пакеты SAS, Stata и R, чтобы продемонстрировать подгонку модели логистической регрессии со смешанными эффектами для метаанализа данных склеротерапии, используя количество событий и количество субъектов в каждом испытании. Мы использовали процедуру glimmix в SAS и команды melogit в Stata и glmer в R. Каждая из них имеет необходимые параметры, но свой метод по умолчанию. Максимальное правдоподобие с адаптивной квадратурой Гаусса-Эрмита (AGHQ) является значением по умолчанию для мелогита в версии 14 Stata, а также для glmer в R. По умолчанию количество точек квадратуры равно 7 в мелогите; в glmer, однако, он равен 1, что сводится к приближению Лапласа. Большее количество квадратурных точек обеспечивает лучшее приближение функции правдоподобия, но улучшение стабилизируется. 20 Процедура SAS glimmix имеет гораздо больше возможностей,а по умолчанию - ограничение максимального правдоподобия (REML) с использованием разложений ряда Тейлора. 21 Чтобы получить оценки параметров дисперсии случайных эффектов, REML максимизирует вероятность, при которой вычитаются фиксированные эффекты (называемая остаточной или ограниченной вероятностью). Оценки, полученные с помощью ML, смещены, когда выборки малы, тогда как оценки REML более объективны. Поэтому REML является хорошей альтернативой ML, когда единственное внимание уделяется оценке компонентов дисперсии. 22 Для согласованности мы используем один и тот же метод оценки, максимальное правдоподобие и AGHQ с 7 квадратурными точками в трех программных процедурах / командах, чтобы продемонстрировать использование логистической регрессии со смешанными эффектами для метаанализа.Метод AGHQ обычно обеспечивает хорошее приближение к правдоподобию и считается наиболее надежным методом приближения для одноуровневых моделей со случайными эффектами. В Приложении перечислены коды для этого анализа в трех программных пакетах. Другие процедуры и команды, такие как PROC nlmixed в SAS и glm и meglm в Stata, также могут использоваться для соответствия моделям логистической регрессии с фиксированными и смешанными эффектами для метаанализа.

Результаты

Отношение шансов вмешательства по сравнению с контролем для каждого из 19 исследований показано на Рисунке 1 (исход смерти) и Рисунке 2 (исход кровотечения). В таблице 3 (исход смерти) и таблице 4 (исход первого кровотечения) на верхней панели показаны результаты для модели со случайными эффектами, а на нижней панели показаны результаты для модели с фиксированным эффектом; каждая панель включает стандартные подходы метаанализа с использованием журнала на уровне исследования (OR) и его предполагаемой дисперсии, а также метаанализы, основанные непосредственно на количестве субъектов и количестве событий. Сначала мы сравниваем результаты традиционных и альтернативных методов в модели случайных эффектов. Затем мы сравниваем эти результаты с результатами модели фиксированного эффекта как для традиционных, так и для альтернативных методов.