Однофакторная линейная регрессия



Цель работы: приобретение навыков построения и анализа линейной функции регрессии для двумерных выборок методом наименьших квадратов.

Краткие теоретические сведения.

Рассмотрим двумерную случайную величину (X, Y). Если зафиксировать значение одной случайной величины, например , тогда значения другой случайной величины Y можно рассматривать как отдельную случайную величину со своим законом распределения и своими числовыми характеристиками, которые называются условными.

Условное математическое ожидание случайной величины при условии, что , называется функцией или уравнением регрессии Y на X: т.е. .

Если же функция  имеет вид: , то регрессия называется линейной.

Установление формы зависимости, оценки функции регрессии и ее параметров являются задачами регрессионного анализа.

Оценкой функции регрессии между случайными величинами X и Y является выборочное уравнение регрессии: , которое получают по данным выборки.

Пусть имеется выборка из двумерной совокупности ( ) , ( ) , …, ( ). Для построения выборочного уравнения регрессии необходимо найти коэффициенты а и b, которые находятся по данной выборке методом наименьших квадратов.

Суть данного метода состоит в том, что находится минимум функции S(a,b):

Для нахождения минимума получаем систему уравнений:

                       

 

После преобразования получаем систему линейных уравнений:

Решая ее, находим а и b и записываем выборочное уравнение регрессии . Для того чтобы установить, соответствует ли выбранная регрессионная модель экспериментальным данным, используют основное уравнение дисперсионного анализа:

                , в котором

 - общая сумма квадратов отклонений: ;

- сумма квадратов, обусловленная регрессией;

 - остаточная сумма квадратов,

 где      , а .

 Для проверки значимости уравнения регрессии для уровня значимости a сначала находим критическую точку  по таблицам Фишера с k1=1 и k2 = n-1 степенями свободы, а затем вычисляем наблюдаемое значение критерия:

 

Если , то уравнение регрессии считается значимым, то есть соответствующим экспериментальным данным на уровне значимости a.

 

Порядок выполнения работы:    

1. Изучить теоретические сведения по теме.

2. Выполнитьзадания №1 –№2, используя заданные преподавателем статистические данные.

3. Провести сравнение и анализ полученных данных.

    4. Оформить отчет.

Задание 1. По второй тройке столбцов выборки C для двумерных выборок XY, XZ, YZ методом наименьших квадратов найти выборочные линейные уравнения регрессии соответственно: Y на X, Z на X, Z на Y и построить их графики.

Методом дисперсионного анализа выяснить значимость полученных линейных уравнений регрессии при уровне значимости a=0,05.

Задание 2. По выборке C для двумерных выборок XY, XZ, YZ найти    выборочные линейные уравнения регрессии соответственно: Y на X, Z на X, Z на Y ; построить их графики и выяснить значимость полученных линейных уравнений регрессии при уровне значимости a=0,05 с помощью инструмента Регрессия Пакета анализа табличного процессора EXCEL.     

 

Решение типовых заданий.

Задание 1. По двумерной выборке XY методом наименьших квадратов найти выборочное линейное уравнение регрессии Y на X .

Методом дисперсионного анализа выяснить значимость полученного уравнения регрессии при уровне значимости a=0,05.

Решение.      Для вычисления параметров уравнения линейной регрессии и проверки его значимости, составим расчетную таблицу 7.1. Исходные данные включены в первые два столбца таблицы, итоговые суммы находятся в последней строке.
                                                                                                                                   Таблица 7.1

- ( - )2
29 -59 -1711 841 -67,91 1,26 1,59 8,91 79,32
30 -67 -2010 900 -70,07 -0,90 0,81 3,07 9,41
30 -71 -2130 900 -70,07 -0,90 0,81 -0,93 0,87
32 -65 -2080 1024 -74,39 -5,22 27,26 9,39 88,13
30 -63 -1890 900 -70,07 -0,90 0,81 7,07 49,94
30 9 -2370 900 -70,07 -0,90 0,81 -8,93 79,80
29 -63 -1827 841 -67,91 1,26 1,59 4,91 24,07
31 -73 -2263 961 -72,23 -3,06 9,37 -0,77 0,60
30 -62 -1860 900 -70,07 -0,90 0,81 8,07 65,07
29 -73 -2117 841 -67,91 1,26 1,59 -5,09 25,95
29 -71 -2059 841 -67,91 1,26 1,59 -3,09 9,57
29 -68 -1972 841 -67,91 1,26 1,59 -0,09 0,01
30 -68 -2040 900 -70,07 -0,90 0,81 2,07 4,27
29 -78 -2262 841 -67,91 1,26 1,59 -10,09 101,88
28 -71 -1988 784 -65,75 3,42 11,70 -5,25 27,61
29 -63 -1827 841 -67,91 1,26 1,59 4,91 24,07
29 -66 -1914 841 -67,91 1,26 1,59 1,91 3,63
27 -66 -1782 729 -63,59 5,58 31,15 -2,41 5,83
27 -58 -1566 729 -63,59 5,58 31,15 5,59 31,20
28 -67 -1876 784 -65,75 3,42 11,70 -1,25 1,57
32 -73 -2336 1024 -74,39 -5,22 27,26 1,39 1,93
29 -73 -2117 841 -67,91 1,26 1,59 -5,09 25,95
31 -80 -2480 961 -72,23 -3,06 9,37 -7,77 60,41
33 -83 -2739 1089 -76,55 -7,38 54,49 -6,45151 41,62
710 -1660 -49216 21054     232,62   762,72

 

     Будем искать функцию регрессии в виде: , где коэффициенты  и находятся из системы:

Подставляя найденные из таблицы 7.1 суммы и n = 24 , получаем систему линейных уравнений:

Решая ее, получим а » -5,25; b » -2.16 ; тогда уравнение регрессии имеет вид:

                                 .

   Выясним значимость полученного уравнения линейной регрессии.

Из таблицы 7.1 видно, что

= 232,62; = 762,72 .

 

Найдем наблюдаемое значение критерия:

=  = 6,71

 

 Задавая уровень значимости  находим по таблицам Фишера со степенями свободы k1=1 и k2 = 24 – 2 ==22 критическую точку  и получим = 4,30.

Поскольку , то выборочное уравнение регрессии значимо.

 

Задание 2.

 Построить для двумерной выборки XY , используемой в Задании 1, функцию линейной регрессии с помощью инструмента Регрессия Пакета анализа табличного процессора EXCEL и построить график линейной регрессии на корреляционном поле.

Решение. Рассмотрим решение данной задачи средствами табличного процессора Excel. Для построения функции регрессии надо ввести в ячейки электронной страницы Excel исходные данные и применить инструмент Регрессия Пакета анализа.( см. рис7.1. и рис.7.2 ) 

 

 

Рис.7.1

                                                    

 

 

                                                                                  Рис .7.2

 

Получаем итоги расчетов, которые изображены на рис.7.3:

ВЫВОД ИТОГОВ:

 


Дата добавления: 2018-04-05; просмотров: 323; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!