Лабораторно-практическая работа №4
Проверка непараметрических гипотез.
Цель работы: формирование умений и навыков проверки статистических гипотез о виде распределения; применение критерия согласия Пирсона для проверки гипотезы о законе распределения.
Краткие теоретические сведения.
Гипотезы о виде распределения называются непараметрическими.
Пусть генеральная совокупность Х имеет какое-то неизвестное распределение. Из генеральной совокупности получена выборка. На основании выборки, построив полигон или гистограмму, или учитывая какие-то другие соображения, составим гипотезу о конкретном распределении генеральной совокупности.
Пусть генеральная совокупность имеет функцию распределения .
Тогда нулевая гипотеза имеет вид:
=Fтеор(х), а альтернативная Fтеор(х).
По выборке мы можем найти эмпирическую функцию распределения . Гипотезу Н0 о распределение генеральной совокупности принимают тогда, когда эмпирическое распределение хорошо согласовывается с теоретическим. Критерий, с помощью которого проверяется гипотеза , называется критерием согласия. Существуют критерии согласия Пирсона, Колмогорова и др.
Рассмотрим критерий согласия (Пирсона).
Пусть данные выборки представлены в виде статистического ряда:
По выборке вычисляем оценки параметров теоретического распределения. Затем по теоретическому распределению вычисляем вероятности , равные тому, что случайная величина X принимает значение xi, т. е. , а затем находим теоретические частоты: , где n-объем выборки.
|
|
Гипотеза Н0 верна, если теоретические и эмпирические частоты mi и ni достаточно мало отличаются друг от друга.
Для проверки гипотезы Н0 качестве критерия берем случайную величину
.
Если верна нулевая гипотеза, то эта статистика имеет распределение с числом степеней свободы df = k – r – 1 где к- число групп (интервалов) , - число параметров, вычисленных по выборке (для распределения Пуассона =1, для нормального распределения =2).
В данной задаче строим правостороннюю критическую область, а критическую точку находим из условия: по таблицам - распределения, где - уровень значимости.
Вычисляем по выборке наблюдаемое значение . Если гипотезу отвергаем, если , то нет оснований отвергнуть гипотезу.
Замечание: Малочисленные частоты (ni <5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы по формуле df = k – r – 1 следует в качестве k принять число групп выборки, оставшихся после объединениячастот.
|
|
1. Проверка гипотезы о распределении генеральной совокупности по закону Пуассона.
Пусть задано эмпирическое распределение дискретной случайной величины Х. Требуется, используя критерий Пирсона, проверить гипотезу о распределении генеральной совокупности по закону Пуассона .
Для того чтобы при уровне значимости проверить гипотезу надо:
1).Найти по заданному эмпирическому распределению выборочную среднюю .
2).Принять в качестве оценки параметра λ распределения Пуассона выборочную среднюю .
3). Найти по формуле Пуассона (см. Приложение 1) вероятности появления ровно i событий в n испытаниях ( i = 0,1,…,k, где k - максимальное число наблюдавшихся событий, n – объем выборки). Вероятности можно найти с помощью функции ПУАССОН ( x; среднее; интегральная) табличного процессора Excel.
4). Найти теоретические частоты по формуле .
5). Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона , приняв число степеней свободы равным , где - число оставшихся групп после объединения частот, если это требовалось.Критическую точку находим по таблице при уровне значимости с числом степеней свободы . Если гипотезу отвергаем, если нет оснований отвергнуть гипотезу о распределении случайной величины по закону Пуассона.
|
|
2. Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона.
Пусть эмпирическое распределение задано в виде последовательности равноотстоящих вариант (берем середину интервала в случае интервального вариационного ряда) и соответствующих им частот:
, - середины интервалов.
Для того чтобы при заданном уровне значимости проверить гипотезу о нормальном распределении генеральной совокупности, надо:
1) Вычислить по выборке выборочную среднюю и стандартное отклонение .
2) Вычислить теоретические частоты по формуле
,
где - шаг (разность между вариантами), - объем выборки,
3) Вычислить
4) Найти критическую точку по таблице при уровне значимости с числом степеней свободы , где -число групп.
5) Если гипотезу отвергаем, если гипотезу принимаем.
Порядок выполнения работы.
1. Изучить теоретические сведения по теме.
2. Выполнить задания № 1- №2, используя заданные преподавателем статистические данные.
|
|
3. Оформить отчет.
Задание №1.
А) По выборке А при уровне значимости проверить гипотезу о распределении Пуассона соответствующей генеральной совокупности и выполнить вычисления с помощью калькулятора и вспомогательной таблицы.
Б) По выборке А при уровне значимости проверить гипотезу о распределении Пуассона соответствующей генеральной совокупности, используя Статистические функции: хи2обр, Пуассон табличного процессора Excel.
Имеем:
Задание №2.
По выборке В при уровне значимости проверить гипотезу о нормальном распределении соответствующей генеральной совокупности и выполнить вычисления с помощью электронных таблиц Excel, используя Статистические функции: хи2обр, нормализация, нормрасп.
Имеем:
Решения типовых заданий:
Исходные данные:
Выборка А:
2 2 1 2 3 1 1 0 2 2 4 3 3 0 3 0 3 2 3 1 2
2 3 0 2 3 0 2 3 3 4 4 1 4 0 0 1 2 4 4 3
0 0 0 2 2 3 2 1 0 0 0 3 1 0 1 2 1 2 2 4
3 0 0 1 0 3 0 0 3 1 3 4 2 3 3 2 0 4
4
Выборка В
107 | 78 | 93 | 81 | 80 | 92 | 126 | 93 | 67 | 50 | 104 | 110 |
120 | 91 | 101 | 91 | 120 | 88 | 69 | 74 | 102 | 65 | 48 | 71 |
103 | 67 | 95 | 112 | 112 | 86 | 99 | 99 | 103 | 122 | 112 | 102 |
92 | 69 | 105 | 106 | 124 | 46 | 72 | 75 | 126 | 73 | 106 | 75 |
80 | 92 | 68 | 112 | 127 | 88 | 93 | 74 | 131 | 51 | 117 | 145 |
96 | 76 | 71 | 138 | 104 | 120 | 67 | 92 | 130 | 99 | 94 | 92 |
97 | 105 | 84 | 78 | 100 | 98 | 114 | 113 | 94 | 108 | 76 | 88 |
91 | 78 | 96 | 81 | 116 | 75 | 120 | 75 | 62 | 113 | 109 | 111 |
127 | 63 | 87 | 86 | 66 | 100 | 75 | 84 | 95 | 121 | 103 | 95 |
70 | 98 | 67 | 148 | 95 | 92 | 105 | 114 | 98 | 102 | 41 | 76 |
114 | 90 | 97 | 111 | 93 | 110 | 79 | 63 | 109 | 69 | 108 | 71 |
111 | 100 | 136 | 92 | 84 | 123 | 84 | 125 | 102 | 96 | 72 | 102 |
90 | 136 | 87 | 132 | 137 | 100 | 102 | 88 | 65 | 75 | 114 | 79 |
122 | 63 | 115 | 90 | 78 | 86 | 122 | 119 | 87 | 115 | 96 | 137 |
106 | 105 | 88 | 75 | 100 | 84 | 71 | 123 | 121 | 94 | 114 | 94 |
93 | 118 | 94 | 102 | 109 | 86 | 45 | 97 | 93 | 43 | 48 | 114 |
85 | 79 | 124 | 89 | 104 | 108 | 108 | 100 | 106 | 102 | 105 | 119 |
71 | 86 | 115 | 82 | 101 |
Задание №1. По выборке А при уровне значимости = 0,02 проверить гипотезу о распределении Пуассона соответствующей генеральной совокупности и выполнить вычисления с помощью калькулятора и таблиц.
1. По данным выборки строим вариационный ряд (таблица 4.3) и найдем по заданному эмпирическому распределению выборочную среднюю :
Таблица 4.3.
Варианты | 0 | 1 | 2 | 3 | 4 |
Частоты | 20 | 12 | 19 | 19 | 9 |
= = =1,81
2. Примем в качестве оценки параметра λ распределения Пуассона выборочную
среднюю
3. Положив i = 0, 1, 2, 3, 4, найдем по формуле Пуассона ( см. Приложение 2) вероятности появления ровно i событий в 79 испытаниях при l=2:
0,1353
0,2707
0,2707
0,1804
0,0902
4. Найдем теоретические частоты по формуле исоставим следующую расчетную таблицу 4.1:
Таблица 4.1.
0 | 20 | 0,1353 | 10,69 | 9,31 | 86,6761 | 8,1081 |
1 | 12 | 0,2707 | 21,39 | -9,39 | 88,1721 | 4,1221 |
2 | 19 | 0,2707 | 21,39 | -2,39 | 5,7121 | 0,267 |
3 | 19 | 0,1804 | 14,25 | 4,75 | 22,5625 | 1,5833 |
4 | 9 | 0,0902 | 7,13 | 1,87 | 3,4969 | 0,4904 |
14,5709 |
Из расчетной таблицы находим наблюдаемое значение = 14,5709. Критическую точку находим по таблице (см. Приложение 1) по уровню значимости =0,02 и числу степеней свободы df = 5-2=3 , получим = 9,837.
Так как > - отвергаем гипотезу о распределении генеральной совокупности по закону Пуассона.
Примечание: Для того, чтобы по выборке А при уровне значимости проверить гипотезу о распределении Пуассона соответствующей генеральной совокупности, надо запрограммировать таблицу в Excel, используя Мастер функций, категория Статистические.
Вероятности находятся с помощью функции (см. рис 4.1 .)
Рис 4.1.
Для нахождения критической точки используется статистическая функция ( см. рис.4.2.)
Рис 4.2.
Задание №2. По выборке В при уровне значимости = проверить гипотезу о нормальном распределении соответствующей генеральной совокупности и выполнить вычисления с помощью таблиц Excel, используя Статистические функции: хи2обр, нормализация, нормрасп.
По данным выборки В построим интервальный вариационный ряд с шагом и данные занесем в таблицу 4.2:
Таблица 4.2
интервалы | [41,53) | [53,65) | [65,77) | [77,89) | [89,101) | [101,113) | [113,125) | [125,137) | [137,148) |
Частоты | 8 | 4 | 32 | 31 | 48 | 42 | 29 | 10 | 5 |
Рассчитаем числовые характеристики выборки и получим: 96, S » 21, .
Запрограммируем таблицу 4.3. в Excel, используя формулы и Статистические функции, в которой:
1) находим с помощью функции Нормализация, где в качестве варианты берем середину частичного интервала: (см. рис 4.3.).
Рис. 4.3.
2)Для нахождения используем функцию
(см. рис.4.4.).
Рис. 4.4.
Полученные значения заносим в таблицу 4.4., объединяя малочисленные частоты двух первых интервалов:
Таблица 4.4.
Для нахождения критической точки используем статистическую функцию
., положив =0,1 и число степеней свободы df= 8-3=5.
Получаем значение =9,2364. Так как < (7,3667 < 9.2364), следовательно, нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.
Содержание отчета.
Отчёт о полученных результатах должен содержать:
ü Тему и цель лабораторной работы;
ü формулировку задания с указанием варианта;
ü решения заданий, в которых результаты вычислений должны быть оформлены в виде таблицы;
ü результаты вычислений, произведенные в табличном процессоре Excel;
ü выводы.
Контрольные вопросы.
- Какие гипотезы называются непараметрическими?
- Как строится эмпирическая функция распределения?
- Что такое критерий согласия и какие критерии согласия вам известны?
- Какие статистические функции табличного процессора Excel используются для проверки гипотезы о распределении генеральной совокупности по закону Пуассона с помощью критерия Пирсона?
- Какие статистические функции табличного процессора Excel используются для проверки гипотезы о нормальном распределении генеральной совокупности с помощью критерия Пирсона?
Дата добавления: 2018-04-05; просмотров: 1289; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!