3. 5 - Смещение, искажение и изменение эффекта | СТАТУС 507

Предварительный просмотр содержимого Рассмотрим рисунок ниже. Если истинное значение находится в центре цели, измеренные отклики в первом случае можно считать надежными, точными или имеющими пренебрежимо малую величину.

Рассмотрим рисунок ниже. Если истинное значение находится в центре цели, измеренные отклики в первом случае можно считать надежными, точными или имеющими незначительную случайную ошибку, но все ответы не соответствуют истинному значению с большим запасом. Получена необъективная оценка. Напротив, цель справа имеет больше случайной ошибки в измерениях, однако результаты действительны, без систематической ошибки. Средний отклик находится точно в центре мишени. Средняя цель отображает нашу цель: наблюдения, которые являются как надежными (небольшая случайная ошибка), так и действительными (без систематической ошибки).

Точность для выборки размером 5

Предвзятость, смешение и изменение эффекта в разделе эпидемиологии

При изучении взаимосвязи между объясняющим фактором и результатом мы заинтересованы в выявлении факторов, которые могут изменять влияние фактора на результат (модификаторы эффекта). Мы также должны осознавать потенциальную предвзятость или искажение результатов исследования, поскольку они могут привести к тому, что сообщаемая ассоциация (или ее отсутствие) может ввести в заблуждение. Смещение и искажение связаны с дизайном измерения и исследования. Дадим определение этим терминам:

Если метод, использованный для выбора субъектов или сбора данных, приводит к неправильной ассоциации,.

ДУМАЙ >>Предвзятость!

Если наблюдаемая ассоциация неверна, потому что другая (скрытая) переменная связана как с потенциальным фактором риска, так и с результатом, но сама по себе она не является причинным фактором,

ДУМАЙ >>Забавно!

Если эффект реален, но величина эффекта различна для разных групп людей (например, мужчины против женщин или черные против белых).

ДУМАЙТЕ >>Модификация эффекта!

Предвзятость в результате дизайна исследования

Предвзятость ограничивает достоверность (возможность измерить истину в рамках дизайна исследования) и обобщаемость (способность уверенно применять результаты к большей совокупности) результатов исследования. Смещение редко устраняется во время анализа. Существует два основных типа предвзятости:

1. Систематическая ошибка отбора:систематическая ошибка при отборе или удержании участников.

  • Предположим, вы выбираете случаи разрыва вращательной манжеты плеча (травма плеча). Многие пожилые люди в той или иной степени испытали эту травму, но никогда не лечились. Лица, которые лечатся врачом, с гораздо большей вероятностью будут диагностированы (и идентифицированы как заболевшие), чем лица, которые не лечатся врачом. Если в исследование включаются только пациенты, получающие медицинскую помощь, будет иметь место систематическая ошибка отбора.
  • Некоторые исследователи могут выявить случаи, основанные на предыдущем контакте. Предположим, новая вспышка связана с определенным воздействием, например, с определенным обезболивающим. Если в пресс-релизе людей, принимающих это обезболивающее, побуждают обратиться в клинику для проверки, чтобы определить, являются ли они пациентом, и эти люди затем станут пациентами для исследования, при отборе выборки возникнет предвзятость. Только те, кто принимал лекарства, оценивались на предмет наличия проблемы. Установление случая на основе предыдущего воздействия создает смещение, которое нельзя устранить после выбора образца.
  • Воздействие может повлиять на выбор средств контроля - например, госпитализированные пациенты с большей вероятностью курили, чем население в целом. Если среди госпитализированных пациентов выбран контроль, взаимосвязь между исходом и курением может быть недооценена из-за повышенной распространенности курения в контрольной популяции.
  • В когортном исследовании люди с похожими характеристиками могут быть потеряны для последующего наблюдения. Например, мобильные люди с большей вероятностью поменяют место жительства и потеряны для дальнейшего наблюдения. Если продолжительность проживания связана с воздействием, то наша выборка смещена в сторону субъектов с меньшим воздействием.
  • В поперечном исследовании выборка могла быть нерепрезентативной для населения в целом. Это приводит к предвзятости. Например, предположим, что исследуемая популяция включает несколько расовых групп, но представители одной расы реже участвуют в типе исследования. Результатом является предвзятость.

2. Информационная ошибка(ошибочная классификация): систематическая ошибка из-за неточного измерения или классификации болезни, воздействия или других переменных.

  • Контрольно-измерительные приборы - неточно откалиброванный прибор, создающий систематическую ошибку.
  • Ошибочный диагноз - если диагностический тест неизменно неточен, может произойти искажение информации.
  • Систематическая ошибка воспоминаний - если люди не могут точно вспомнить экспозиции, может возникнуть информационная ошибка.
  • Отсутствующие данные - если у определенных лиц постоянно отсутствуют данные, может возникнуть информационная ошибка.
  • Социально желательный ответ - если участники исследования будут постоянно давать ответ, который исследователь хочет услышать, возникнет информационная предвзятость.

Ошибочная классификация может быть дифференциальной или недифференциальной .

Неужели мы более склонны ошибочно классифицировать случаи, чем контрольные? Например, если вы опрашиваете пациентов лично в течение длительного периода времени, извлекая точную информацию, в то время как контрольные группы опрашиваются по телефону в течение более короткого периода времени с использованием стандартных вопросов, это может привести к дифференциальной неверной классификации статуса воздействия между контрольными объектами. и футляры.

Любой тип неправильной классификации может привести к ошибочным результатам.

Раздел «Смешение и смешение»

Сложность: ситуация, в которой мера связи или взаимосвязи между воздействием и результатом искажается из-за наличия другой переменной. Имеются как положительное смешение (когда наблюдаемая ассоциация смещена от нуля), так и отрицательное смешение (когда наблюдаемая ассоциация смещена в сторону нуля).

Замешивающаяпеременная: посторонняя переменная, которая полностью или частично объясняет наблюдаемое влияние фактора риска на статус заболевания. Наличие мешающей переменной может привести к неточным результатам.

Конфаундер удовлетворяет всем трем условиям, перечисленным ниже:

  1. Это фактор риска заболевания, не зависящий от предполагаемого фактора риска.
  2. Это связано с предполагаемым фактором риска.
  3. Это не причинный путь между воздействием и заболеванием.

Первые два из этих условий можно проверить с помощью данных. Третий более биологический и концептуальный.

Смешивание маскирует истинное влияние фактора риска на заболевание или исход из-за наличия другой переменной. Мы определяем потенциальные источники помех из наших:

  1. Знание
  2. Предыдущий опыт работы с данными
  3. Три критерия искажающих факторов

Пример 3-6: Смешивающая секция

В рамках поперечного исследования мы опрашиваем пациентов, спрашивая, есть ли у них ишемическая болезнь сердца и диабетики. Формируем таблицу 2 × 2 (ниже):

«0» указывает на тех, кто не страдает ишемической болезнью сердца, «1» - для тех, кто страдает ишемической болезнью сердца; аналогично для диабета «0» означает отсутствие, а «1» - наличие диабета.

Распространенность ишемической болезни сердца среди людей без диабета составляет 91 разделенное на 2340, или 3,9% всех людей с диабетом страдают ишемической болезнью сердца. Аналогичным образом распространенность среди больных диабетом составляет 12,04%. Наш коэффициент распространенности с учетом того, является ли диабет фактором риска ишемической болезни сердца, составляет 12,04 / 3,9 = 3,1. Распространенность ишемической болезни сердца у людей с диабетом в 3,1 раза выше, чем у людей без диабета.

Мы также можем использовать таблицу 2 x 2 для расчета отношения шансов, как показано выше:

(2249 × 26) / (91 × 190) = 3,38

Шансы заболеть диабетом среди людей с ишемической болезнью сердца в 3,38 раза выше, чем шансы заболеть диабетом среди тех, кто не страдает ишемической болезнью сердца.

Что из этого вы используете? Они дают несколько разные оценки.

Это зависит от вашей основной цели. Ваша цель - сравнить распространенность? Или вы хотите рассмотреть вероятность дибетеса, связанного с состоянием здоровья коронарных артерий?

Теперь давайте добавим гипертонию как потенциальную помеху.

Спросите: «Является ли гипертония фактором риска ИБС (среди недиабетиков)?»

Прежде всего, предварительные знания говорят нам, что гипертония связана со многими сердечными заболеваниями. Предварительные знания - важный первый шаг, но давайте проверим это на данных.

Рассмотрим таблицу 2 × 2 ниже:

Мы оцениваем связь ИБС с гипертонией у людей, не страдающих диабетом. Вы можете рассчитать коэффициенты распространенности и отношения шансов в соответствии с вашими целями.

Эти данные показывают, что существует положительная взаимосвязь между гипертонией и ИБС у людей, не страдающих диабетом. (обратите внимание на маленькие p-значения)

Это подводит нас к следующему вопросу: «Связан ли диабет (воздействие) с гипертонией?»

На это мы также можем ответить с помощью наших данных (ниже):

Опять же, результаты очень значительны! Таким образом, наши первые два критерия были соблюдены в отношении гипертонии как фактора, влияющего на взаимосвязь между диабетом и ишемической болезнью сердца.

Последний вопрос: «Является ли гипертония промежуточным звеном между диабетом (воздействием) и развитием ИБС?» - или, наоборот, диабет вызывает гипертонию, которая затем вызывает ишемическую болезнь сердца? Судя по биологии, это не так. Диабет сам по себе может вызвать ишемическую болезнь сердца. Используя данные и наши предыдущие знания, мы заключаем, что артериальная гипертензия является основным фактором, влияющим на взаимосвязь между диабетом и ИБС.

Что нам делать теперь, когда мы знаем, что гипертония мешает?

Стратифицировать. рассмотрим несколько стратифицированных оценок.

Пример 3-7: Раздел поперечного исследования

Стратификация и корректировка - взаимосвязь диабета и ИБС, осложненная гипертонией:

Ранее мы пришли к приблизительному отношению шансов 3,38.

Теперь мы будем использовать расширенный метод Maentel Hanzel для корректировки на гипертонию и получения скорректированного отношения шансов. Когда мы это сделаем, скорректированное OR = 2,84.

Метод Mantel-Haenszel учитывает влияние страты, наличие или отсутствие гипертонии.

Если мы ограничим анализ нормотензивными средствами, мы получим отношение шансов 2,4.

Для гипертоников отношение шансов составляет 3,04.

Обе оценки отношения шансов ниже, чем отношение шансов для всей выборки. Если вы стратифицируете выборку без потери каких-либо данных, разве вы не ожидаете, что грубое отношение шансов окажется средневзвешенным из стратифицированных отношений шансов?

Это пример смешения - оба стратифицированных результата находятся на одной стороне грубого отношения шансов. Это положительное смешение, поскольку нестратифицированная оценка отклоняется от нулевой гипотезы. Нулевое значение равно 1.0. Истинное отношение шансов, учитывающее эффект гипертонии, составляет 2,8 по тесту Ментеля-Ханзеля. Приблизительное отношение шансов, равное 3,38, было отклонено от нулевого значения 1,0. (В некоторых исследованиях вы ищете положительную ассоциацию; в других - отрицательную ассоциацию, защитный эффект; в любом случае, отличное от нуля 1,0)

Это один из способов продемонстрировать наличие смешения. Вы можете иметь априорную информацию о смешанных эффектах или можете изучить данные и определить, существуют ли смешанные эффекты. В любом случае, если присутствует смешение, как в этом примере, должно быть указано скорректированное отношение шансов. В этом примере мы сообщаем отношение шансов для ассоциации диабета с ИБС = 2,84 с поправкой на гипертензию.

Если вы анализируете данные с использованием многовариантной логистической регрессии, практическое правило заключается в том, что если отношение шансов изменяется на 10% или более, включите потенциальную конфаундер в модель с несколькими переменными. Вопрос не столько в статистической значимости, сколько в том, насколько мешающая переменная изменяет эффект. Если переменная изменяет эффект на 10% или более, мы считаем это фактором, вызывающим затруднения, и оставляем его в модели.

Мы поговорим об этом позже, но вкратце рассмотрим некоторые методы контроля мешающей переменной (известной априори):

  • рандомизировать людей в разные группы (использовать экспериментальный подход)
  • ограничить / фильтровать для определенных групп
  • совпадение в исследованиях случай-контроль
  • анализ (стратификация, корректировка)

Контроль потенциальных искажающих факторов начинается с хорошего дизайна исследования, включая прогнозирование потенциальных искажающих факторов.

Секция модификации (взаимодействия) эффекта

В предыдущем примере мы видели, что обе оценки отношения шансов для конкретной страты находились в одной стороне от грубого отношения шансов. При модификации эффекта мы ожидаем, что приблизительное отношение шансов будет между оценками отношения шансов для оценок, специфичных для страты.

Рассмотрим следующие примеры:

  1. Иммунизационный статус человека изменяет эффект воздействия патогена и конкретных типов инфекционных заболеваний. Почему?
  2. Рак груди встречается как у мужчин, так и у женщин. Рак груди у мужчин встречается примерно у 1,5 на 100 000 мужчин. Рак груди встречается у женщин примерно у 122,1 случая на 100 000 женщин. Это примерно 800-кратная разница. Мы можем построить статистическую модель, которая показывает, что пол взаимодействует с другими факторами риска рака груди, но почему это так? Очевидно, что существует множество биологических причин, по которым это взаимодействие должно присутствовать. Это та часть, на которую мы хотим взглянуть с эпидемиологической точки зрения. Подумайте, поддерживает ли биология статистическое взаимодействие, которое вы могли бы наблюдать.
Зачем изучать модификацию эффектов? Почему нас это волнует?
  • определить подгруппы повышенного риска для предупреждающих действий,
  • повысить точность оценки эффекта за счет учета групп, которые могут быть затронуты по-разному,
  • для увеличения возможности сравнения исследований с разным соотношением групп, влияющих на эффект, и
  • чтобы помочь в разработке причинных гипотез болезни

Если вы не определите и не обработаете модификатор эффекта должным образом, вы получите неверную грубую оценку. (Неверная) грубая оценка (например, RR, OR) представляет собой средневзвешенное значение (правильных) оценок для конкретного слоя. Если вы не отсортируете результаты, относящиеся к конкретному слою, вы упустите возможность понять биологическую или психосоциальную природу взаимосвязи между фактором риска и исходом.

Чтобы учесть изменение эффекта при планировании и проведении исследования:

  1. Соберите информацию о потенциальных модификаторах эффекта.
  2. Включите исследование для проверки потенциальных модификаторов эффекта - если вы априори считаете, что эффект может отличаться в зависимости от страты, включите исследование, чтобы обнаружить разницу.
  3. Не сравнивайте потенциально важный модификатор эффекта - если вы это сделаете, вы не сможете изучить его эффект.

Чтобы учесть изменение эффекта при анализе данных:

  1. Опять же, подумайте, какими могут быть потенциальные модификаторы эффекта.
  2. Стратифицировать данные по модификаторам потенциального эффекта и рассчитать оценки воздействия риска на результат для конкретных слоев; определить, присутствует ли модификация эффекта. Если так,
  3. Представьте оценки для конкретных слоев. Используйте тест Бреслоу-Дея на однородность отношений шансов из расширенного метода Мантела-Хензеля или тест логарифмического правдоподобия -2 из логистической регрессии, чтобы проверить статистическую значимость модификаторов потенциального эффекта и рассчитать оценки связи между воздействием и заболеванием в соответствии с уровни значимых модификаторов эффекта. В качестве альтернативы, если предположения выполняются, используйте регрессию пропорциональных рисков для получения скорректированного отношения рисков.

Пример 3-8: Диабет как риск ишемической болезни сердца Раздел

Когда вы объединяете мужчин и женщин, грубое отношение шансов = 4,30.

Стратифицируя по полу, мы можем вычислить разные меры. Посмотрите на вышеупомянутые отношения шансов. Отношение шансов для женщин составляет 6,66 по сравнению с приблизительным отношением шансов 4,30. Таким образом, женщины подвергаются гораздо большему риску развития диабета, который может привести к ишемической болезни сердца. Для мужчин отношение шансов составляет 2,23.

Риск развития сердечно-сосудистых заболеваний у мужчин и женщин при диабете? да. Это такой же уровень риска? Нет. Для мужчин OR составляет 2,23, для женщин - 6,66. Общая оценка ближе к средневзвешенному из двух оценок для конкретных слоев. Пол изменяет влияние диабета на сердечные заболевания. Мы можем видеть это численно, потому что грубое отношение шансов более репрезентативно для средневзвешенного значения двух групп.

Какова наиболее информативная оценка риска диабета при сердечных заболеваниях? 4.30 не очень информативно описывает истинные отношения. Гораздо более информативно представить анализ конкретного слоя.

Во время анализа данных можно определить основные факторы, влияющие на факторы, и модификаторы эффекта путем сравнения стратифицированных результатов с общими результатами.

Таким образом, процесс выглядит следующим образом:

  1. Сделайте приблизительную (нескорректированную) оценку между воздействием и заболеванием.
  2. Стратифицировать анализ по любым потенциальным основным искажающим факторам для получения оценок для конкретной страты.
  3. Сравните приблизительную оценку с оценками для конкретных слоев и изучите вид выявленных взаимосвязей.
  • С недоумением:
    • грубая оценка (например, ОР, ОШ) находится за пределами диапазона двух оценок, специфичных для страты (в примере с гипертонией - грубое отношение шансов было выше, чем у обоих коэффициентов для конкретной страты);
    • Если скорректированная оценка существенно (не обязательно статистически) отличается (часто на 10%) от грубой оценки, то «скорректированная переменная» является помехой. Другими словами, если включение потенциального искажающего фактора изменяет оценку риска на 10% или более, мы считаем это важным и оставляем его в модели.
    • Статистические методы (расширенный метод Мантеля-Хензеля, множественная регрессия, множественная логистическая регрессия, пропорциональные риски) доступны для расчета «скорректированной» оценки с учетом искажающих факторов.
    • грубая оценка (например, RR, OR) ближе к средневзвешенному значению оценок, специфичных для страты;
    • две специфичные для страты оценки отличаются друг от друга
    • Сообщайте об отдельных стратифицированных моделях или об условиях взаимодействия.

    Вкратце, искажающие факторы маскируют истинный эффект, а модификаторы эффекта означают, что для разных групп существует разный эффект.

    Вы дошли до конца материала для чтения для 3-й недели. Перейдите к занятиям 3-й недели на Canvas.