Проверка гипотез о законе распределения
Проверка статистических гипотез.
Статистическая гипотеза -- это предположение о генеральной совокупности, высказанное на основании статистических выборочных данных.
Статистическая проверка гипотез -- это процедура обоснованного сопоставления высказанной гипотезы с имеющимися выборочными данными.
Например: исследуем влияние нового лекарственного препарата на снижение артериального давления.
X{x1, x2, … xn1} -- контрольная группа (выборка, объёмом n1)
Y{y1, y2, … yn2} -- опытная группа (выборка объёмом n2)
Высказываются две альтернативные гипотезы:
Н0: -- различия между выборками не достоверны (т.е. носят случайный характер).
Н: -- различия между выборками достоверны (т.е. влияние препарата достоверно (эффективно))
Чтобы принять или опровергнуть эти предположения, используют статистические критерии или критерии достоверности.
Статистический критерий -- это случайная величина, закон распределения которой известен, т.е. каждому значению критерия поставлена в соответствие вероятность, с которой он эти значения принимает.
Для каждого критерия существует таблица, в которой содержатся критические значения критерия. Каждое критическое значение соответствует определённому уровню значимости α и числу степеней свободы (или к)
где а -- число наложенных связей или ограничений.
α=1-РД -- это вероятность принять ошибочную гипотезу.
|
|
Критические значения позволяют определить вероятность нулевой гипотезы: Р(Н0).
Гипотеза Н0 принимается, если в результате проверки выяснилось, что её вероятность больше выбранного уровня значимости.
если Р(Н0)>α , то Н0 принимаем,
если Р(Н0)<α , то Н0 отвергаем.
Например: Хотим доказать достоверность различия между выборками X{x1, x2, … xn1}иY{y1, y2, … yn2} с РД=0,95 (это значит, что влияние препарата достоверно (эффективно) на 95%).
Если в результате проверки выяснилось, что Р(Н0)˃α , (т.е. ˃0,05), то мы вынуждены принять гипотезу Н0, так как Р(Н)<РД
Р(Н)<0,95.
Основные этапы проверки статистических гипотез.
1).Выдвигается гипотеза Н0.
2).Выбирается величина уровня значимости α (α=1-РД).
3).По заданному α и числу степеней свободы ν(или к) в таблице находим критическое (табличное) значение критерия.
4).Подсчитывается экспериментальное значение критерия по имеющимся выборкам (для каждого критерия существует формула для определения значения критерия).
5).С помощью сравнения экспериментального и критического значений делается вывод о правомерности гипотезы Н0.
6).Если Н0 принимается, следовательно гипотеза Н (о достоверности различий) не верна.
|
|
Если Н0 отвергается, следовательно верна гипотеза Н..(Н0 и Н -- противоположные события).
Критерии достоверности подразделяются на параметрические и непараметрические.
Параметрическиекритерии для вычисления экспериментального значения используют статистические параметры: . Они могут использоваться для выборочных совокупностей, распределённых по закону близкому к нормальному (Гаусса).
Непараметрические критерии не требуют вычисления выборочных параметров, они менее точны, дают более грубую оценку, чем параметрические критерии, но:
1). Их можно применять к выборкам, закон распределения которых неизвестен (не обязательно нормальное распределение).
2). Они проще и позволяют быстрее производить проверку рассматриваемых гипотез.
Проверка гипотез о законе распределения.
Проверку гипотезы о законе распределения (то есть, соответствует ли выборочная совокупность какому либо определённому распределению) проводят с помощью критерия соответствия (предложен К.Пирсоном в 1900г.).
Критерий Пирсона ( ).
Н0заключается в том, что различие между наблюдаемыми экспериментальными частотами mi попадания вариант выборки в интервалы вариационного ряда от вычисленных теоретических частот mi теор=mi·Pi теор не достоверно (т.е. носит случайный характер). Другими словами:
|
|
Н0: экспериментальные данные соответствуют предложенному теоретическому закону распределения.
Экспериментальное значение критерия вычисляется по формуле:
где -- объём выборки, к -- количество интервалов,
-- вероятность попадания в интервал для теоретического распределения.
Затем, по таблице критерия Пирсона для заданного уровня значимости α и числа степеней свободы , где а -- число наложенных связей, находим .
если теоретическое распределение произвольное, то а=1,
если теоретическое распределение распределено по нормальному закону Гаусса, то а=3 -- числу параметров, необходимых для вычисления вероятности: М[X],D[X] и σ[X],. следовательно
Если Н0 принимаем.
Вывод: экспериментальное распределение соответствует теоретическому.
Если Н0 отвергаем.
Вывод: экспериментальное распределение не соответствует теоретическому.
Пример: Изучался рост 50 человек. В таблице приведены экспериментальные частоты попадания в интервал mi и теоретические частоты, рассчитанные из вероятностей попадания в интервал для распределения Гаусса. К=5 , n=50.ν=5-3=2,
|
|
№ интервала | 1 | 2 | 3 | 4 | 5 |
mi практические | 5 | 9 | 22 | 8 | 6 |
mi теоретические | 5 | 10 | 20 | 10 | 5 |
0,1 | 0,2 | 0,4 | 0,2 | 0,1 |
Н0: Экспериментальное (практическое) распределение соответствует распределению Гаусса. (То есть различие между частотами не достоверно, носит случайный характер).
Из таблицы для ν=5-3=2 и ά=0,05 находим =5,99
Т.к. Н0 принимаем.
Вывод: практическое распределение соответствует распределению Гаусса.
Критерий Стьюдента.
Параметрический критерий , который используют для проверки статистических гипотез по выборкам, распределённым по нормальному закону Гаусса.
Используется:
1). Для определения достоверности среднего арифметического, полученного для одной выборки.
2). Для определения достоверности различия средних арифметических двух выборок.
3). Для определения достоверности корреляции двух случайных величин.
Дата добавления: 2018-04-05; просмотров: 458; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!