S.3.2 Проверка гипотез (подход P-значения) Подход P-значения включает определение вероятного или маловероятного путем определения вероятности (при условии, что нулевая гипотеза верна)
Р -value подход включает в себя определение «вероятно» или «маловероятны» путем определения вероятности - при условии , нулевая гипотеза верна - наблюдения более экстремальной тестовой статистики в направлении альтернативной гипотезы , чем тот , которая наблюдается. Если значение P небольшое, скажем, меньше (или равно) \ (\ alpha \), то это «маловероятно». И, если значение P велико, скажем, больше, чем \ (\ alpha \), то оно «вероятно».
Если значение P меньше (или равно) \ (\ alpha \), то нулевая гипотеза отклоняется в пользу альтернативной гипотезы. И, если значение P больше, чем \ (\ alpha \), нулевая гипотеза не отклоняется.
В частности, четыре шага, связанные с использованием подхода P- значения для проведения любой проверки гипотезы:
В нашем примере, касающемся среднего среднего балла, предположим, что наша случайная выборка из n = 15 студентов, специализирующихся на математике, дает тестовую статистику t *, равную 2,5. Поскольку n = 15, наша тестовая статистика t * имеет n - 1 = 14 степеней свободы. Также предположим, что мы установили наш уровень значимости α равным 0,05, так что у нас есть только 5% шанс сделать ошибку типа I.
Значение P для проведения теста с правым хвостомH 0 : μ = 3 по сравнению с H A : μ >3 - это вероятность того, что мы наблюдаем статистику теста больше, чем t * = 2,5, если бы среднее значение генеральной совокупности \ (\ mu \) на самом деле было 3. Напомним, что вероятность равна площади под кривой вероятности. Таким образом, P -значение представляет собой площадь под кривой t n - 1 = t 14 и справа от тестовой статистики t * = 2,5. С помощью статистического программного обеспечения можно показать, что P-значение 0,0127. График это изображает визуально.
Значение P , 0,0127, говорит нам, что «маловероятно», что мы наблюдали бы такую экстремальную тестовую статистику t * в направлении H A, если бы нулевая гипотеза была верна. Следовательно, наше первоначальное предположение о том, что нулевая гипотеза верна, должно быть неверным. То есть, поскольку значение P , 0,0127, меньше \ (\ alpha \) = 0,05, мы отклоняем нулевую гипотезу H 0 : μ = 3 в пользу альтернативной гипотезы H A : μ >3.
Обратите внимание, что мы не отклонили бы H 0 : μ = 3 в пользу H A : μ >3, если бы мы снизили нашу готовность сделать ошибку типа I до \ (\ alpha \) = 0,01 вместо этого, как значение P , 0,0127. , тогда больше, чем \ (\ alpha \) = 0,01.
В нашем примере, касающемся среднего среднего балла, предположим, что наша случайная выборка из n = 15 студентов, специализирующихся на математике, дает тестовую статистику t * вместо -2,5. P -value для проведения левого хвостатыхтеста H 0 : μ = 3 по сравнению с Н А : ц т * = -2,5 , если население среднего μ действительно было 3. Следовательно, P -значение - это площадь под t n - 1 = t 14кривой и слева от тестовой статистики t * = -2,5. С помощью статистического программного обеспечения можно показать, что значение P равно 0,0127. График это изображает визуально.
Значение P , 0,0127, говорит нам, что «маловероятно», что мы наблюдали бы такую экстремальную тестовую статистику t * в направлении H A, если бы нулевая гипотеза была верна. Следовательно, наше первоначальное предположение о том, что нулевая гипотеза верна, должно быть неверным. То есть, поскольку значение P , 0,0127, меньше α = 0,05, мы отклоняем нулевую гипотезу H 0 : μ = 3 в пользу альтернативной гипотезы H A : μ
Обратите внимание, что мы не отказались бы от H 0 : μ = 3 в пользу H A : μ P , 0,0127, тогда больше, чем \ (\ альфа \) = 0,01.
В нашем примере, касающемся среднего среднего балла, предположим снова, что наша случайная выборка из n = 15 студентов, специализирующихся на математике, дает тестовую статистику t * вместо -2,5. P -value для проведения двухвостоготеста H 0 : μ = 3 по сравнению с Н А : ц ≠ 3 является вероятностью того, что мы наблюдали бы тестовую статистику меньше , чем -2.5 или более 2,5 , если население среднего μ действительно было 3 То есть, двусторонний тест требует учета возможности того, что тестовая статистика может попасть в любой из хвостов (отсюда и название «двусторонний» тест). P-значение - это площадь под кривой t n - 1 = t 14 слева от -2,5 и справа от 2,5. С помощью статистического программного обеспечения можно показать, что значение P равно 0,0127 + 0,0127 или 0,0254. График это изображает визуально.
Обратите внимание, что значение P для двустороннего теста всегда в два раза больше значения P для любого из односторонних тестов. Значение P , 0,0254, говорит нам, что «маловероятно», что мы наблюдали бы такую экстремальную статистику теста t * в направлении H A, если бы нулевая гипотеза была верна. Следовательно, наше первоначальное предположение о том, что нулевая гипотеза верна, должно быть неверным. То есть, поскольку значение P , 0,0254, меньше α = 0,05, мы отклоняем нулевую гипотезу H 0 : μ = 3 в пользу альтернативной гипотезы H A : μ ≠ 3.
Обратите внимание, что мы не отклонили бы H 0 : μ = 3 в пользу H A : μ 3, если бы вместо этого снизили нашу готовность совершить ошибку типа I до α = 0,01, поскольку значение P 0,0254 больше, чем \ (\ альфа \) = 0,01.
Теперь, когда мы рассмотрели процедуры подхода к критическому значению и P- значению для каждой из трех возможных гипотез, давайте рассмотрим три новых примера - один из правостороннего теста, один из левостороннего и один из двухстороннего теста. Хвостатый тест.
Хорошая новость заключается в том, что, когда это возможно, мы будем использовать статистику тестов и P-значения, сообщаемые в статистическом программном обеспечении, таком как Minitab, для проведения наших тестов гипотез в этом курсе.