Проверка гипотез о законе распределения

Проверка статистических гипотез.

Статистическая гипотеза -- это предположение о генеральной совокупности, высказанное на основании статистических выборочных данных.

Статистическая проверка гипотез -- это процедура обоснованного сопоставления высказанной гипотезы с имеющимися выборочными данными.

Например: исследуем влияние нового лекарственного препарата на снижение артериального давления.

X{x₁, x₂, … x_n₁} -- контрольная группа (выборка, объёмом n₁)

Y{y₁, y₂, … y_n₂} -- опытная группа (выборка объёмом n₂)

Высказываются две альтернативные гипотезы:

Н₀: -- различия между выборками не достоверны (т.е. носят случайный характер).

Н: -- различия между выборками достоверны (т.е. влияние препарата достоверно (эффективно))

Чтобы принять или опровергнуть эти предположения, используют статистические критерии или критерии достоверности.

Статистический критерий -- это случайная величина, закон распределения которой известен, т.е. каждому значению критерия поставлена в соответствие вероятность, с которой он эти значения принимает.

Для каждого критерия существует таблица, в которой содержатся критические значения критерия. Каждое критическое значение соответствует определённому уровню значимости α и числу степеней свободы (или к)

где а -- число наложенных связей или ограничений.

α=1-Р_Д_-- это вероятность принять ошибочную гипотезу.

Критические значения позволяют определить вероятность нулевой гипотезы: Р(Н₀).

Гипотеза Н₀принимается, если в результате проверки выяснилось, что её вероятность больше выбранного уровня значимости.

если Р(Н₀)>α , то Н₀ принимаем,

если Р(Н₀)<α , то Н₀ отвергаем.

Например: Хотим доказать достоверность различия между выборками X{x₁, x₂, … x_n₁}иY{y₁, y₂, … y_n₂} с Р_Д=0,95 (это значит, что влияние препарата достоверно (эффективно) на 95%).

Если в результате проверки выяснилось, что Р(Н₀)˃α , (т.е. ˃0,05), то мы вынуждены принять гипотезу Н₀, так как Р(Н)<Р_Д

Р(Н)<0,95.

Основные этапы проверки статистических гипотез.

1).Выдвигается гипотеза Н_0.

2).Выбирается величина уровня значимости α (α=1-Р_Д).

3).По заданному α и числу степеней свободы ν(или к) в таблице находим критическое (табличное) значение критерия.

4).Подсчитывается экспериментальное значение критерия по имеющимся выборкам (для каждого критерия существует формула для определения значения критерия).

5).С помощью сравнения экспериментального и критического значений делается вывод о правомерности гипотезы Н₀.

6).Если Н₀ принимается, следовательно гипотеза Н (о достоверности различий) не верна.

Если Н₀ отвергается, следовательно верна гипотеза Н..(Н₀ и Н -- противоположные события).

Критерии достоверности подразделяются на параметрические и непараметрические.

Параметрическиекритерии для вычисления экспериментального значения используют статистические параметры: . Они могут использоваться для выборочных совокупностей, распределённых по закону близкому к нормальному (Гаусса).

Непараметрические критерии не требуют вычисления выборочных параметров, они менее точны, дают более грубую оценку, чем параметрические критерии, но:

1). Их можно применять к выборкам, закон распределения которых неизвестен (не обязательно нормальное распределение).

2). Они проще и позволяют быстрее производить проверку рассматриваемых гипотез.

Проверка гипотез о законе распределения.

Проверку гипотезы о законе распределения (то есть, соответствует ли выборочная совокупность какому либо определённому распределению) проводят с помощью критерия соответствия (предложен К.Пирсоном в 1900г.).

Критерий Пирсона ( ).

Н₀заключается в том, что различие между наблюдаемыми экспериментальными частотами m_i попадания вариант выборки в интервалы вариационного ряда от вычисленных теоретических частот m_i _теор=m_i·P_i _теор не достоверно (т.е. носит случайный характер). Другими словами:

Н₀: экспериментальные данные соответствуют предложенному теоретическому закону распределения.

Экспериментальное значение критерия вычисляется по формуле:

где -- объём выборки, к -- количество интервалов,

-- вероятность попадания в интервал для теоретического распределения.

Затем, по таблице критерия Пирсона для заданного уровня значимости α и числа степеней свободы , где а -- число наложенных связей, находим .

если теоретическое распределение произвольное, то а=1,

если теоретическое распределение распределено по нормальному закону Гаусса, то а=3 -- числу параметров, необходимых для вычисления вероятности: М[X],D[X] и σ[X],. следовательно

Если Н₀принимаем.

Вывод: экспериментальное распределение соответствует теоретическому.

Если Н₀ отвергаем.

Вывод: экспериментальное распределение не соответствует теоретическому.

Пример: Изучался рост 50 человек. В таблице приведены экспериментальные частоты попадания в интервал m_i и теоретические частоты, рассчитанные из вероятностей попадания в интервал для распределения Гаусса. К=5 , n=50.ν=5-3=2,

№ интервала	1	2	3	4	5
m_i практические	5	9	22	8	6
m_i теоретические	5	10	20	10	5
	0,1	0,2	0,4	0,2	0,1

Н₀: Экспериментальное (практическое) распределение соответствует распределению Гаусса. (То есть различие между частотами не достоверно, носит случайный характер).

Из таблицы для ν=5-3=2 и ά=0,05 находим =5,99

Т.к. Н₀ принимаем.

Вывод: практическое распределение соответствует распределению Гаусса.

Критерий Стьюдента.

Параметрический критерий , который используют для проверки статистических гипотез по выборкам, распределённым по нормальному закону Гаусса.

Используется:

1). Для определения достоверности среднего арифметического, полученного для одной выборки.

2). Для определения достоверности различия средних арифметических двух выборок.

3). Для определения достоверности корреляции двух случайных величин.

Дата добавления: 2018-04-05; просмотров: 458; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 Следующая ⇒

Мы поможем в написании ваших работ!