Однофакторная линейная регрессия
Цель работы: приобретение навыков построения и анализа линейной функции регрессии для двумерных выборок методом наименьших квадратов.
Краткие теоретические сведения.
Рассмотрим двумерную случайную величину (X, Y). Если зафиксировать значение одной случайной величины, например , тогда значения другой случайной величины Y можно рассматривать как отдельную случайную величину со своим законом распределения и своими числовыми характеристиками, которые называются условными.
Условное математическое ожидание случайной величины при условии, что , называется функцией или уравнением регрессии Y на X: т.е. .
Если же функция имеет вид: , то регрессия называется линейной.
Установление формы зависимости, оценки функции регрессии и ее параметров являются задачами регрессионного анализа.
Оценкой функции регрессии между случайными величинами X и Y является выборочное уравнение регрессии: , которое получают по данным выборки.
Пусть имеется выборка из двумерной совокупности ( ) , ( ) , …, ( ). Для построения выборочного уравнения регрессии необходимо найти коэффициенты а и b, которые находятся по данной выборке методом наименьших квадратов.
Суть данного метода состоит в том, что находится минимум функции S(a,b):
Для нахождения минимума получаем систему уравнений:
После преобразования получаем систему линейных уравнений:
|
|
Решая ее, находим а и b и записываем выборочное уравнение регрессии . Для того чтобы установить, соответствует ли выбранная регрессионная модель экспериментальным данным, используют основное уравнение дисперсионного анализа:
, в котором
- общая сумма квадратов отклонений: ;
- сумма квадратов, обусловленная регрессией;
- остаточная сумма квадратов,
где , а .
Для проверки значимости уравнения регрессии для уровня значимости a сначала находим критическую точку по таблицам Фишера с k1=1 и k2 = n-1 степенями свободы, а затем вычисляем наблюдаемое значение критерия:
Если , то уравнение регрессии считается значимым, то есть соответствующим экспериментальным данным на уровне значимости a.
Порядок выполнения работы:
1. Изучить теоретические сведения по теме.
2. Выполнитьзадания №1 –№2, используя заданные преподавателем статистические данные.
3. Провести сравнение и анализ полученных данных.
4. Оформить отчет.
Задание 1. По второй тройке столбцов выборки C для двумерных выборок XY, XZ, YZ методом наименьших квадратов найти выборочные линейные уравнения регрессии соответственно: Y на X, Z на X, Z на Y и построить их графики.
|
|
Методом дисперсионного анализа выяснить значимость полученных линейных уравнений регрессии при уровне значимости a=0,05.
Задание 2. По выборке C для двумерных выборок XY, XZ, YZ найти выборочные линейные уравнения регрессии соответственно: Y на X, Z на X, Z на Y ; построить их графики и выяснить значимость полученных линейных уравнений регрессии при уровне значимости a=0,05 с помощью инструмента Регрессия Пакета анализа табличного процессора EXCEL.
Решение типовых заданий.
Задание 1. По двумерной выборке XY методом наименьших квадратов найти выборочное линейное уравнение регрессии Y на X .
Методом дисперсионного анализа выяснить значимость полученного уравнения регрессии при уровне значимости a=0,05.
Решение. Для вычисления параметров уравнения линейной регрессии и проверки его значимости, составим расчетную таблицу 7.1. Исходные данные включены в первые два столбца таблицы, итоговые суммы находятся в последней строке.
Таблица 7.1
- | ( - )2 | |||||||
29 | -59 | -1711 | 841 | -67,91 | 1,26 | 1,59 | 8,91 | 79,32 |
30 | -67 | -2010 | 900 | -70,07 | -0,90 | 0,81 | 3,07 | 9,41 |
30 | -71 | -2130 | 900 | -70,07 | -0,90 | 0,81 | -0,93 | 0,87 |
32 | -65 | -2080 | 1024 | -74,39 | -5,22 | 27,26 | 9,39 | 88,13 |
30 | -63 | -1890 | 900 | -70,07 | -0,90 | 0,81 | 7,07 | 49,94 |
30 | 9 | -2370 | 900 | -70,07 | -0,90 | 0,81 | -8,93 | 79,80 |
29 | -63 | -1827 | 841 | -67,91 | 1,26 | 1,59 | 4,91 | 24,07 |
31 | -73 | -2263 | 961 | -72,23 | -3,06 | 9,37 | -0,77 | 0,60 |
30 | -62 | -1860 | 900 | -70,07 | -0,90 | 0,81 | 8,07 | 65,07 |
29 | -73 | -2117 | 841 | -67,91 | 1,26 | 1,59 | -5,09 | 25,95 |
29 | -71 | -2059 | 841 | -67,91 | 1,26 | 1,59 | -3,09 | 9,57 |
29 | -68 | -1972 | 841 | -67,91 | 1,26 | 1,59 | -0,09 | 0,01 |
30 | -68 | -2040 | 900 | -70,07 | -0,90 | 0,81 | 2,07 | 4,27 |
29 | -78 | -2262 | 841 | -67,91 | 1,26 | 1,59 | -10,09 | 101,88 |
28 | -71 | -1988 | 784 | -65,75 | 3,42 | 11,70 | -5,25 | 27,61 |
29 | -63 | -1827 | 841 | -67,91 | 1,26 | 1,59 | 4,91 | 24,07 |
29 | -66 | -1914 | 841 | -67,91 | 1,26 | 1,59 | 1,91 | 3,63 |
27 | -66 | -1782 | 729 | -63,59 | 5,58 | 31,15 | -2,41 | 5,83 |
27 | -58 | -1566 | 729 | -63,59 | 5,58 | 31,15 | 5,59 | 31,20 |
28 | -67 | -1876 | 784 | -65,75 | 3,42 | 11,70 | -1,25 | 1,57 |
32 | -73 | -2336 | 1024 | -74,39 | -5,22 | 27,26 | 1,39 | 1,93 |
29 | -73 | -2117 | 841 | -67,91 | 1,26 | 1,59 | -5,09 | 25,95 |
31 | -80 | -2480 | 961 | -72,23 | -3,06 | 9,37 | -7,77 | 60,41 |
33 | -83 | -2739 | 1089 | -76,55 | -7,38 | 54,49 | -6,45151 | 41,62 |
710 | -1660 | -49216 | 21054 | 232,62 | 762,72 |
|
|
|
|
Будем искать функцию регрессии в виде: , где коэффициенты и находятся из системы:
Подставляя найденные из таблицы 7.1 суммы и n = 24 , получаем систему линейных уравнений:
Решая ее, получим а » -5,25; b » -2.16 ; тогда уравнение регрессии имеет вид:
.
Выясним значимость полученного уравнения линейной регрессии.
Из таблицы 7.1 видно, что
= 232,62; = 762,72 .
Найдем наблюдаемое значение критерия:
= = 6,71
Задавая уровень значимости находим по таблицам Фишера со степенями свободы k1=1 и k2 = 24 – 2 ==22 критическую точку и получим = 4,30.
Поскольку , то выборочное уравнение регрессии значимо.
Задание 2.
Построить для двумерной выборки XY , используемой в Задании 1, функцию линейной регрессии с помощью инструмента Регрессия Пакета анализа табличного процессора EXCEL и построить график линейной регрессии на корреляционном поле.
Решение. Рассмотрим решение данной задачи средствами табличного процессора Excel. Для построения функции регрессии надо ввести в ячейки электронной страницы Excel исходные данные и применить инструмент Регрессия Пакета анализа.( см. рис7.1. и рис.7.2 )
Рис.7.1
Рис .7.2
Получаем итоги расчетов, которые изображены на рис.7.3:
ВЫВОД ИТОГОВ:
Дата добавления: 2018-04-05; просмотров: 323; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!