Лабораторно-практическая работа №3



ПРОВЕРКА ПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ

Цель работы: формирование умений и навыков проверки параметрических гипотез.

Краткие теоретические сведения.

Статистическая гипотезаутверждение о виде неизвестного распределения или о параметрах известных распределений. Гипотеза, подлежащая проверке, называется нулевой или основной (H0). Конкурирующей (альтернативной)называют гипотезу H1, которая противоречит нулевой.

Для проверки нулевой гипотезы используют специально подобранную случайную величину K , которая называется статистическим критерием.

Критической областью, называется совокупность значений критерия, при котором нулевую гипотезу отвергают.

Областью принятия гипотез,называют совокупность значений критерия, при котором гипотезу принимают.

Критическими точкамикр), называют точки, отделяющие критическую область от области принятия гипотез.

Наблюдаемые значения критериянабл.) – называются значения критерия вычисленные по выборке.

  Основной принцип проверки гипотез формулируется так:

Если наблюдаемое значение критерия принадлежит критической области, гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то ее принимают (нет оснований отвергнуть гипотезу).

Схема статистической проверки гипотез.

1. Формулировка нулевой и альтернативной гипотез.

2. Выбор уровня значимости и критерия для проверки Н0.

3. Нахождение критической точки, критической области и области принятия гипотезы.

4. Вычисление значения критерия по выборке.

5. Принятие решения.

Проверка параметрических гипотез.

Гипотезы о параметрах известных распределений называются параметрическими. Предполагаем, что выборки сделаны из генеральных совокупностей, имеющих нормальное распределение.

 1) Проверка гипотезы о среднем значении.

 Пусть генеральная средняя а неизвестна, но имеется основание предполагать, что она равна значению , т.е. требуется проверить гипотезу:

Н0 : а = а0        при уровне значимости α.

В качестве критерия берем случайную величину

где S – стандартное отклонение, n – объем выборки,  - выборочная средняя.

Если гипотеза Н0 верна, то Т имеет распределение Стьюдента с (n – 1) степенями свободы.

1. Если альтернативная гипотеза Н1: а ≠ а0 , то строим двустороннюю критическую область. Критическую точку ищем по таблице Стьюдента для двусторонней критической области из условия:

                                

2. Если альтернативная гипотеза Н1: а > a0 , то строим правостороннюю критическую область. Критическую точку ищем по таблице Стьюдента для односторонней критической области из условия:

,

3. Если альтернативная гипотеза Н1: а < a0 , то строим левостороннюю критическую область. Сначала находим вспомогательную критическую точку  из таблицы Стьюдента для односторонней критической области из условия:

, а затем полагаем 

2) Проверка гипотезы о дисперсиинормального распределения.

Пусть дисперсия  генеральной совокупностинеизвестна, но имеется основание предполагать, что она равна значению , т.е. требуется проверить гипотезу:

 Н0 :        при уровне значимости α.

 

 В качестве критерия используем случайную величину:

Если гипотеза Н0  верна, то случайная величина  имеет - распределение Пирсона с (n–1) степенями свободы, где n – объем выборки.

1. Если альтернативная гипотеза Н1: , то строим левостороннюю критическую область. Критическую точку ищем по таблице с (n–1) степенями свободы из условия:

2. Если альтернативная гипотеза Н1: , то строим правостороннюю критическую область. Критическую точку ищем по таблице с (n–1) степенями свободы из условия:

3. Если альтернативная гипотеза Н1: , то строим двустороннюю критическую область. Критическую точку ищем по таблице с (n–1) степенями свободы из условия:

 3).  Гипотеза оравенстве двух средних значений.

Пусть заданы две генеральные совокупности с нормальным распределением X и Y, которые имеют средние значения соответственно а1 и а2 , при этом их дисперсии неизвестны, но должны быть равными. Из этих генеральных совокупностей сделаны выборки с параметрами:

для совокупности Х:                               для совокупности Y:

n1 – объем выборки                                  n2 – объем выборки 

    - выборочная средняя                         - выборочная средняя                         

    - исправленная дисперсия                  - исправленная дисперсия

Для проверки нулевой гипотезы Н0 : а1 = а2 при уровне значимости α используем критерий:

Если нулевая гипотеза Н0 верна, то она имеет распределение Стьюдента с ( ) степенями свободы.

1. Если альтернативная гипотеза Н1: а1≠ а2 , то строим двустороннюю критическую                 область. Критическую точку ищем по таблице Стьюдента для двусторонней критической области из условия:

,

2. Если альтернативная гипотеза Н1: а1 > а2 , то строим правостороннюю критическую область. Критическую точку находим по таблице Стьюдента для односторонней критической области из условия:

,

3. Если альтернативная гипотеза Н1: а1 < а2 , то строим левостороннюю критическую область. Сначала находим вспомогательную критическую точку   из таблицы Стьюдента с уровнем значимости α и числом степеней свободы( ) для односторонней области из условия: , а затем полагаем

4) . Гипотеза о равенстве двух дисперсий.

Пусть даны две генеральные совокупности X и Y с нормальными распределениями, причем их дисперсии   неизвестны, но есть основания считать их равными. Из этих совокупностей сделаны независимые выборки с параметрами:

 Для совокупности Х:                               Для совокупности Y:

n1 – объем выборки                                  n2 – объем выборки 

    - исправленная дисперсия                  - исправленная дисперсия

Требуется при уровне значимости α проверить нулевую гипотезу

Н0 :  

Для проверки этой гипотезы в качестве критерия используем случайную величину: 

                                     ,   

Если гипотеза Н0 верна, то случайная величина F имеет распределение Фишера с k1= n1 – 1 и k2=n2 – 1 степенями свободы.

При альтернативной гипотезе Н1 :  строим правостороннюю критическую область. Критическую точку ищем по таблице Фишера с k1, k2 степенями свободы из условия:  

                                 .

Порядок выполнения работы.

1. Изучить теоретические сведения по теме.

2. Выполнить задания №1 -№5, считая, что заданные преподавателем статистические данные получены из генеральных совокупностей с нормальным распределением.

3. Оформить отчет.

Задание №1.

А) По второму столбцу Y выборки С при уровне значимости  проверить гипотезу о среднем значении Н0 :  при альтернативной гипотезе Н1:  M, где

                 

Б) Проверить гипотезу, используя Пакет анализа средство Двухвыборочный t- тест с различными дисперсиями.

Задание №2.

А) По второму столбцу Z выборки С при уровне значимости     проверить гипотезу о дисперсии Н0: при альтернативной гипотезе Н1:  T, где 

  

                 

Б) Проверить гипотезу, используя Статистические функции средство Хи2обр.

 Задание №3.

А) По столбцам F1 и F2 выборки D при уровне значимости   проверить гипотезу о равенстве средних значении Н0 : а1= а2 при альтернативной гипотезе Н1: а1 а2, если неизвестные дисперсии обеих совокупностей считать равными ( - выборочные средние соответственно выборок F1 иF2).

  

Б) Проверить гипотезу, используя Пакет анализа средство Двухвыборочный t- тест с одинаковыми дисперсиями.

 Задание №4.

А) По столбцам F3 и F4 выборки D при уровне значимости   проверить гипотезу о равенстве  дисперсий Н0 : 12 = 2 2 при альтернативной гипотезе Н1: 12  > 22 .

             

Б) Проверить гипотезу, используя Пакет анализа средство Двухвыборочный F- тест для дисперсии.

Задание №5.

 А) По первым двум столбцам Х выборки С при уровне значимости   проверить сначала гипотезу о равенстве дисперсий и, если она принимается, то затем гипотезу о равенстве средних значений.

              

 Б) Проверить гипотезу с помощью Пакета анализа, используя сначала средство  Двухвыборочный F- тест для дисперсии,  а затем средство Двухвыборочный t- тест с одинаковыми дисперсиями.

Решение типовых заданий.

Задание №1.А) По второму столбцу Y выборки С при уровне значимости =0,05 проверить гипотезу о среднем значении Н0 :  при альтернативной гипотезе Н1:  > M, где М= {целая часть (  -4)}.

Решение: Имеем исходные данные Y: 605,632,554,594,612,556,679,629,582,611,626,703,650,655,577,657,613,557,619.

 Рассчитаем числовые характеристики выборки и получим  616,37, S=41,29. 

Пусть М = { -4} = {616,37 – 4}= {612,37} = 612, тогда нулевая и альтернативная гипотезы имеют вид:

Н0 :

Н1:  

Для проверки этой гипотезы в качестве критерия берем случайную величину:

     

Т.к. Н1: а > a0 , то строим правостороннюю критическую область. Критическую точку находим из таблицы распределения Стьюдента для односторонней области с n -1 = 19-1= 18 степенями свободы и уровнем значимости =0,05. Имеем xкр=1,73.

Тогда получаем, что при  - критическая область, а при  - область принятия гипотезы.

 Найдем наблюдаемое значение Тнабл по соответствующей формуле:

= =0,46 

Следовательно, наблюдаемое значение Тнабл находится в области принятия гипотезы, то нет оснований отвергнуть нулевую гипотезу.

Б). Проверить гипотезу о среднем значении:   при уровне значимости =0,1, используя Пакет анализа средство Двухвыборочный t- тест с различными дисперсиями. Исходные данные приведены на рис.3.3.

Для проверки гипотезы используем Пакет анализа  средство Двухвыборочный t- тест с различными дисперсиями (рис.3.1., 3.2., 3.3.)

 


    Рис.3.1.  

 


                          

     Рис.3.2.                                                                                                        Рис.3.3.  

 

 

Получаем вывод итогов, которые даны в таблице 3.1.:

                                                                                                                     

 

 

                                                                                                                 Таблица 3.1.

По виду альтернативной гипотезы строим левостороннюю критическую область и критическая точка ( t критическое одностороннее) xкр = -1,31946024 , поэтому -критическая область.   = -0,69180176 ( t – статистка) принадлежит области принятия гипотезу,значит, нет оснований отвергнуть нулевую гипотезу.

  Задание №2.

 По второму столбцу Z выборки С при уровне значимости  =0,02 проверить гипотезу о дисперсии Н0: при альтернативной гипотезе Н1: T, где Т= {целая часть( S2 -1)}.

Исходные данные Z: 66,68,66,60,58,60,76,61,59,56,61,69,70,68,54,70,71,54,61.

Рассчитаем числовые характеристики выборки и получим S2 = 39,48. 

Пусть Т ={S2-1} = {39,48 – 1}= {38,48} = 38, тогда нулевая и альтернативная гипотезы будут выглядеть так:

Н0:

Н1: 38

Для проверки этой гипотезы в качестве критерия берем случайную величину:

           .

Т.к. Н1: , то строим двустороннюю критическую область. Критическую точку находим из таблицы -распределения с n -1 = 19-1=18 степенями свободы и уровнем значимости ( ) = 1- 0,01=0,99. Имеем

Тогда получаем, что при  - критическая область,  - область принятия гипотезы.

 Вычисляем наблюдаемое значение  по соответствующей формуле:

= = 18,70.

 Так как наблюдаемое значение  находится в критической области, то нулевую гипотезу о дисперсии нормального распределения отвергаем.

Примечание: При проверке гипотезы о значении дисперсии для нахождении критической точки можно использовать Статистические функции средство Хи2обр (рис3.4, 3.5.).

 

               Рис.3.4.  

 

                   Рис.3.5.   

 

Задание №3.

А) По столбцам F3 и F4 выборки D при уровне значимости =0,1 проверить гипотезу о равенстве средних значении Н0 : а1= а2 при альтернативной гипотезе Н1: а1 < а2, если неизвестные дисперсии обеих совокупностей считать равными.

Исходные данные:

      F3                                                          F4

114,105,103,122,118,113,107.                  120,113,109,111,102,116,113.

Рассчитаем числовые характеристики выборок и получим

   для выборки F3: , , n1=7,

   для выборки F4: , , n2=7.

 Тогда нулевая и альтернативная гипотезы будут выглядеть так:

Н0 :  а1= а2

Н1:  а1 < а2

Для проверки нулевой гипотезы Н0 : а1 = а2 при уровне значимости α  используем критерий:

Так как альтернативная гипотеза имеет вид Н1: а1 < а2 , то строим левостороннюю критическую область. Сначала находим вспомогательную критическую точку  из таблицы распределения Стьюдента для односторонней области с = 7 + 7- 2= 12 степенями свободы и уровнем значимости  =0,1. Получим = 1,36, значит

  

Тогда получаем, что T < -1,36 - критическая область, а при T > -1,36 область принятия гипотезы.

Найдем наблюдаемое значение Тнабл по соответствующей формуле:

 

 

Следовательно, так как наблюдаемое значение Тнабл находится в области принятия гипотезы, то нет оснований отвергнуть нулевую гипотезу.

 Б) Проверить гипотезу о равенстве средних значении Н0 : а1= а2 при альтернативной гипотезе Н1: а1 а2  и уровне значимости =0,001 ,  используя Пакет анализа средство Двухвыборочный t- тест с одинаковыми дисперсиями . Исходные данные приведены на рис.3.8.

                  Рис.3.8.   

                              Рис.3.6.   

                              Рис.3.7.   

Получаем вывод итогов, которые приведены в таблице 3.2.

 

 

                                                                                                    

 

 

                                                                                                             Таблица 3.2.

По виду альтернативной гипотезы строим двухстороннюю критическую область и

из таблицы 3.2. видно, что x кр = 4,586893858 (t критическое двустороннее) и -критическая область. Наблюдаемое значение Тнабл = -0,467767581 ( t –статистика) находится в области принятия гипотезы, значит нет оснований отвергнуть нулевую гипотезу.

Задание №4.

А) По столбцам F3 и F4 выборки D при уровне значимости  = 0,01 проверить гипотезу о равенстве дисперсий Н0 : 12 = 2 2 при альтернативной гипотезе Н1: 12  > 22 .

 Исходные данные:

      F3                                                           F4

114,105,103,122,118,113,107.                  120,113,109,111,102,116,113.

Рассчитаем числовые характеристики выборок и получим

   для выборки F3: , n1=7,

   для выборки F4: , n2=7.

Тогда нулевая и альтернативная гипотезы будут выглядеть так:

     Н0 : 12 = 2 2 

     Н1: 12  > 22 .

Для проверки нулевой гипотезы при уровне значимости α используем критерий:

                                     , т.к.   

Если гипотеза Н0 верна, то случайная величина F имеет распределение Фишера с k1= 7 – 1 = 6 и k2 = 7 – 1= 6 степенями свободы.

При альтернативной гипотезе Н1 :  строим правостороннюю критическую область. Критическую точку ищем по таблице Фишера с k1= 6, k2 =6 степенями свободы и уровнем значимости  = 0,01: . Получим .

Тогда получаем, что при F > 8,47 - критическая область, а при F < 8,47 - область принятия гипотезы.

Найдем наблюдаемое значение Fнабл по соответствующей формуле:

=  = 1,54

 Так как наблюдаемое значение Fнабл находится в области принятия гипотезы, то нет оснований отвергнуть нулевую гипотезу.

Б) По столбцам F3 и F4 (см. рис 3.10.) при уровне значимости =0,05 проверить гипотезу о равенстве дисперсий Н0 : 12 = 2 2 при альтернативной гипотезе Н1: 12> 22 .

Проверим гипотезу, используя Пакет анализа средство Двухвыборочный F- тест для дисперсии (см. рис.3.9.,3.10.).                            

                              Рис.3.9.                                                     Рис.3.10.

                                  Рис.3.11.

 Получаем вывод итогов, которые приведены в таблице 3.3  .

                                                                                                     Таблица 3.3.

По виду альтернативной гипотезы строим правостороннюю критическую область. Из таблицы 3.3. видно, что критическая точка xкр = 5,050329058 (F критическое одностороннее) и F > 5.05 критическая область,  а наблюдаемое значение критерия F =1.130909091. Так как F принадлежит области принятия решений, то нет оснований отвергнуть нулевую гипотезу.

 Задание № 5.

А) По первым двум столбцам Х выборки С при уровне значимости = 0,01 проверить сначала гипотезу о равенстве дисперсий и, если она принимается, то затем гипотезу о равенстве средних значений.

Исходные данные:

Х1: 29,30,28,31,32,28,28,30,29,29,29,30,29,30,29,30,30,28,29,31,29,30,29,29.

X2: 30,30,29,32,30,30,29,30,31,29,29,29,30,29,28,29,29,27,28,27, 32,29,31,33.

Рассчитаем числовые характеристики выборок и получим:

1) Сначала проверяем гипотезу о равенстве дисперсий.

Для проверки этой гипотезы в качестве критерия берем случайную величину:

               

Если верна гипотеза , то  имеет распределение Фишера с  степенями свободы. Поскольку альтернативная гипотеза имеет вид , то строим правостороннюю критическую область.

Критическую точку ищем по таблице Фишера при =0,01 с  степенями свободы из условия . Получим .

 При -критическая область

Вычисляем наблюдаемое значение критерия

  принадлежит области принятия решений , следовательно нет оснований отвергнуть нулевую гипотезу.

2) Проверяем гипотезу о равенстве средних значений:

Для проверки этой гипотезы в качестве критерия берем:

При альтернативной гипотезе  строим двухстороннюю критическую область.

Критическую точку ищем по таблице Стьюдента для двухсторонней области с уровнем значимости =0,01 и числом степеней свободы . Получим, что  . Следовательно при -критическая область.

 

   принадлежит области принятия решений, значит нет оснований отвергнуть нулевую гипотезу.

Примечание: Чтобы проверить гипотезу, рассматриваемую в задании №5, с помощью Пакета анализа, необходимо сначала применить средство  Двухвыборочный F- тест для дисперсии,  а затем средство Двухвыборочный t- тест с одинаковыми дисперсиями.

 

Содержание отчета.

Отчёт о полученных результатах должен содержать:

ü Тему и цель лабораторной работы;

ü формулировку задания с указанием варианта;

ü  решения заданий;

ü результаты вычислений, произведенные в табличном процессоре Excel;

ü выводы.

 

Контрольные вопросы.


Дата добавления: 2018-04-05; просмотров: 297; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!