Лабораторно-практическая работа №5



Однофакторный дисперсионный анализ.

Цель работы: приобретение навыков оценки влияния фактора на результат эксперимента посредством проверки гипотезы о равенстве средних значений для всех уровней фактора F по заданной выборке.

Краткие теоретические сведения.  

Дисперсионный анализ – это статистический метод анализа результатов наблюдений, зависящих от различных одновременно действующих факторов, выбор наиболее важных факторов и оценка их влияния.

Результатом эксперимента является некоторая случайная величина Х, называемая результативным признаком. На значения случайной величины Х влияют факторы, состоящие из нескольких уровней или групп. Идея дисперсионного анализа заключается в разложении общей дисперсии случайной величины на независимые случайные слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействие. Последующее сравнение этих дисперсий позволяет оценить существенность влияния факторов на исследуемую величину.

Пусть, например, Х - исследуемая случайная величина; А и В – влияющие на нее факторы; а  - среднее значение случайной величины Х.

Допустим, что отклонение случайной величины Х при действии факторов А и В на исследуемую величину можно представить в виде суммы:

                                         ,

где  - отклонение, вызванное фактором ,  - отклонение, вызванное фактором ,  - отклонение, вызванное другими неучтенными или случайными факторами. Обозначим дисперсии величин Х,  соответственно через    и получим равенство .

Сравнивая факторные дисперсии с остаточной дисперсией, можно установить степень влияния факторов А и В на случайную величину Х по сравнению с неучтенными факторами.

Если изучается влияние одного фактора на случайную величину Х, то дисперсионный анализ называется однофакторным.

Однофакторный дисперсионный анализ.

Рассмотрим пример: Пусть в каком-то цехе несколько станков выполняют одинаковые операции. Для планирования дальнейшей обработки деталей нужно знать все ли станки дают одинаковую продукцию или нет. Иначе говоря, можно ли игнорировать влияние фактора (т.е. станков) на продукцию или нет.

Решение:

Пусть в цехе  станков (фактор имеет  уровней). Из каждого уровня (продукция каждого станка) сделаем выборку из элементов. Общее количество элементов .

Значения заносим в таблицу 5.1:

                                                                                                           Таблица 5.1

1 2
1  
2  
       
 
 

 

Полагая, что выборки сделаны из нормально распределенной генеральной совокупности, задавая уровень значимости , проверяем гипотезу о равенстве средних значений генеральных совокупностей на всех уровнях фактора.

не все  равны между собой

В качестве критерия используем случайную величину :

где

 - факторная дисперсия, характеризующая влияние исследуемого фактора;

 - остаточная дисперсия, характеризующая влияние остальных случайных факторов.

Если гипотеза  верна, то случайная величина имеет распределение Фишера с           степенями свободы.

При проверке нулевой гипотезы строим правостороннюю критическую область, критическую точку находим по таблицам Фишера из условия: .

По результатам выборки находим .

Если , то нулевую гипотезу отвергаем, т.е. считаем влияние исследуемого фактора на случайную величину Х значимым.

Если   нулевую гипотезу принимаем, т.е. считаем, что значимость влияния фактора не установлена.

Для нахождения величины  надо найти:

1) сумму квадратов отклонений элементов выборки относительно выборочной средней:

,         (1)

где

2) среднее значение по уровням фактора ( выборочные средние по группам):

,

3) сумму квадратов межгрупповых отклонений, которая характеризует влияние исследуемого фактора по формулам:

- (для одинакового количества элементов на всех уровнях)      или - где nj – число элементов на j – том уровне (для различного количества элементов на всех уровнях).

4) сумму квадратов внутригрупповых отклонений, которая характеризует влияние остальных неучтенных факторов:

,      

 причем выполняется равенство:

На основании сумм Q, Q1, Q2 можно вычислить соответствующие дисперсии:

На практике обычно находят Q и Q1, а Q2 находят из формулы:

 

Результаты вычислений удобно представить в виде таблицы 5.2:

Таблица 5.2

Компоненты дисперсии Сумма квадратов отклонений Число степеней свободы Дисперсии
Межгрупповая

внутригрупповая
Общая

 

Применение дисперсионного анализа предполагает, что генеральные групповые совокупности случайных величин имеют нормальное распределение и равные дисперсии.

Порядок выполнения работы:

1. Изучить теоретические сведения по теме.

2. Выполнить задания №1-№3, используя заданные преподавателем статистические данные.

3. Оформить отчет.

 

Задание №1.

По выборке D с уровнем значимости a проверить гипотезу Но о равенстве средних значений для всех уровней фактора F. Оценить значимость влияния фактора.

 

                  

Задание №2.

По выборке E с уровнем значимости a проверить гипотезу Но о равенстве средних значений для всех уровней фактора F. Оценить значимость влияния фактора.

 

   

 

Алгоритм расчета однофакторного дисперсионного анализа.

 - найти групповые средние по уровням фактора   и общую среднюю ;

- найти сумму квадратов отклонений элементов выборки от общей средней (Q), сумму квадратов отклонений групповых средних от общей средней (Q1) и сумму квадратов внутригрупповых отклонений (Q2);

- определить степени свободы k1= m – 1 и k2= N-m;

 - вычислить соответствующие дисперсии S²¸S1²,S2² и значение F;

 - c помощью таблицы F – распределения найти критическую область;

 - сравнить F и Fкр.;

 - оценить значимость влияния фактора ( гипотеза Но принимается или отвергается).

Задание №3.

 Выполнить Задание №1 и №2 в табличном процессоре EХCEL с помощью инструмента Пакета анализа Однофакторный дисперсионный анализ. Сравнить полученные в EХCEL результаты с выводами ручного счета.

 

Решение типовых заданий:

Задание №1. По выборке D при уровне значимости a=0,05 проверить гипотезу Но о равенстве средних значений для всех уровней фактора F. Оценить значимость влияния фактора.

Решение:  Пусть получены данные эксперимента:

NO F1 F2 F3 F4 F5 F6 F7
1 133 138 138 128 144 138 147
2 134 125 143 134 146 145 135
3 141 131 135 140 142 134 135
4 132 137 137 141 144 133 142
5 139 151 145 126 139 143 129
6 132 140 128 139 140 144 122

 Для выборки имеем  n=6, m=7, N=42, =0,05.

 

1). Найдем групповые средние по уровням фактора   и занесем полученные данные в таблицу 5.3;

                                                                                                                       Таблица 5.3.

F1 F2 F3 F4 F5 F6 F7
1 133 138 138 128 144 138 147
2 134 125 143 134 146 145 135
3 141 131 135 140 142 134 135
4 132 137 137 141 144 133 142
5 139 151 145 126 139 143 129
6 132 140 128 139 140 144 122
135,2 137 137,7 134,7 142,5 139,5 135

 

Найдем общую среднюю по формуле  и получим: 137,4

2) Найдем сумму квадратов отклонений элементов выборки от общей средней (Q), сумму квадратов отклонений групповых средних от общей средней (Q1) и сумму квадратов внутригрупповых отклонений (Q2);

a) сумма квадратов отклонений элементов выборки от общей средней находится по формуле:

         Q =  =(133-137,4)2+(134-137,4)2+(141-137,4)2+… 1716,6                                  

b) сумма квадратов отклонений групповых средних от общей средней:

             =6{(135,2-137,4)2 +(137-137,4)2+…} 292  

c) сумма квадратов внутригрупповых отклонений:

 Q2 = Q – Q1 = 1716,6 - 292 = 1424,6

3). Вычислим степени свободы: k1= m – 1 = 7 – 1 =6; k2= N – 1 = 42 – 7 = 35

4). Рассчитаем соответствующие дисперсии S²¸S1²,S2² , вычислим значение F и занесем полученные данные в таблицу 5.4;

 

= = 41,8

= = 48,67

= =40,7

= 1,2

                                                                                                                        Таблица 5.4.

Компоненты дисперсии Сумма квадратов отклонений Число степеней свободы Дисперсии  MS
межгрупповая  Q1 = 292 k1 = 6 = 48,67

внутригрупповая Q2 = 1424,6  k2 = 35 =40,7
Общая Q = 1716,6  41  

 

5).   С помощью таблицы Фишера (см. Приложение 6) по уровню значимости =0,05

и числу степеней свободы  находим критическую точку и получаем

. Поскольку , то нет оснований отвергнуть нулевую гипотезу. Следовательно, значимость влияния фактора не установлена.

Задание №2.  Выполнить Задание №1 в табличном процессоре EХCEL с помощью инструмента Пакета анализа Однофакторный дисперсионный анализ. Сравнить полученные с помощью пакета EХCEL результаты с выводами ручного счета.

Для выполнения задания воспользуемся инструментом Пакета анализа Однофакторный дисперсионный анализ (рис. 5.1,5.2)

 

Рис5.1.

                                    Рис 5.2.

Вводим в таблицу Excel исходные данные по столбцам и применим инструмент Пакета анализа Однофакторный дисперсионный анализ,  указав уровень значимости =0,05.

 Получим вывод итогов, которые изображены на рис.5.3.

Однофакторный дисперсионный анализ

 

 

 

 

 

 

 

 

 

 

 

 

ИТОГИ

 

 

 

 

 

 

Группы

Счет

Сумма

Среднее

Дисперсия

 

 

Столбец 1

6

811

135,16667

14,966

 

 

Столбец 2

6

822

137

77,2

 

 

Столбец 3

6

826

137,66667

36,66666

 

 

Столбец 4

6

808

134,66667

41,4666667

 

 

Столбец 5

6

855

142,5

7,1

 

 

Столбец 6

6

837

139,5

27,5

 

 

Столбец 7

6

810

135

79,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

Источник вариации

SS

df

MS

F

P-Значение

F критическое

Между группами

293,1429

6

48,857143

1,202

0,3282

2,3717

Внутри групп

1422,5

35

40,642857

 

 

 

 

 

 

 

 

 

 

Итого

1715,643

41

 

 

 

 

Рис.5.3.

Дадим анализ итогов. В таблице Дисперсионный анализ    приведены значения межгрупповой дисперсии (48,857143) , внутригрупповой (40,642857) и промежуточные расчеты. В графе F дано наблюдаемое значение критерия Fнабл. = 1,202 и Fкрит.= 2,3717. Поскольку Fнабл. < Fкрит , нет оснований отвергнуть нулевую гипотезу. Следовательно, значимость влияния фактора не установлена.

Содержание отчета.

Отчёт о полученных результатах должен содержать:

ü Тему и цель лабораторной работы;

ü формулировку задания с указанием варианта;

ü  решения заданий, в которых результаты вычислений должны быть оформлены в виде таблицы;

ü результаты вычислений, произведенные в табличном процессоре Excel; 

ü  сравнительный анализ и выводы.

 

Контрольные вопросы.

1. Что называется однофакторным дисперсионным анализом?

2. В чем заключается метод дисперсионного анализа?

3. Какие условия применения метода дисперсионного анализа?

4. Приведите общую схему расчета однофакторного дисперсионного анализа.

5. Какое средство табличного процессора Excel предназначено для решения задач с использованием однофакторного дисперсионного анализа?


Дата добавления: 2018-04-05; просмотров: 360; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!