Лабораторно-практическая работа №6
Корреляционный анализ.
Цель работы: приобретение навыков оценки взаимозависимости между случайными величинами по выборочным данным с помощью корреляционных полей, корреляционных таблиц и выборочных коэффициентов корреляции.
Краткие теоретические сведения.
Основной задачей корреляционного анализа является выявление тесноты связи между случайными величинами X и Y и количественная оценка тесноты этой связи.
Две случайные величины могут быть независимыми, либо связанные функциональной зависимостью (крайне редко), либо стохастической зависимостью.
Стохастическойназывают зависимость, при которой изменение одной из случайных величин влечет изменение распределения другой. Если стохастическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой, то такая зависимость называется корреляционной. Корреляционная зависимость между переменными величинами – это та функциональная зависимость, которая существует между значениями одной из них и групповыми средними другой. Определение корреляционной связи между случайными величинами можно осуществлять с помощью наглядных (предварительных) и расчетных методов. К наглядным методам относится построение корреляционных полей или корреляционных таблиц. К расчетным – вычисление выборочного коэффициента корреляции, который характеризует степень линейной функциональной зависимости между случайными величинами X и Y.
|
|
Корреляционное поле.
Пусть получена двумерная выборка:
На плоскости отмечаем точки с координатами
Если эти точки ложатся в форме шара или подковы, то линейная корреляция отсутствует. Если они ложатся вдоль воображаемой прямой, то корреляционная связь существует.
Корреляционные таблицы.
Варианты или интервалы значений одной случайной величины записывают в первую строку корреляционной таблицы, а варианты или интервалы другой случайной величины – в первый столбец.
… | ||||
… | ||||
По каждой паре значений ( ) выборки определяют в какую клетку таблицы она попадает. Если частоты располагаются вдоль главной или побочной диагоналей, то присутствует линейная корреляция.
Коэффициент корреляции.
Основной оценкой тесноты линейной связи между случайными величинами служит выборочный коэффициент корреляции rв, который для несгруппированных данных вычисляется по формуле:
или
Свойства коэффициента корреляции:
1. Выборочный коэффициент корреляции удовлетворяет неравенству ;
|
|
2. Если , то связь положительна, если , то связь отрицательна;
3. Если , то между и существует функциональная линейная зависимость;
4. Чем ближе к 1, тем теснее линейная связь между случайными величинами;
5. Если , то и, возможно, существует нелинейная связь между случайными величинами.
6. Если = 0, то случайные величины независимы, при условии что они имеют нормальное распределение.
Выборочный коэффициент корреляции, является оценкой коэффициента корреляции генеральной совокупности.
Допустим, что выборочный коэффициент корреляции оказался отличным от нуля, т.е. . Поскольку выборка случайна, то надо проверить гипотезу о значимости выборочного коэффициента корреляции (или о равенстве нулю коэффициента корреляции генеральной совокупности). Если гипотеза о равенстве нулю коэффициента корреляции генеральной совокупности будет отвергнута, то выборочный коэффициент корреляции значим, а СВ X и Y коррелированы.
Проверяем нулевую гипотезу
при альтернативной
Для проверки задаем уровень значимости и критерий:
Если верна гипотеза , то критерий имеет распределение Стьюдента с (n-2) степенями свободы. Строим двухстороннюю критическую область. Критическую точку ищем по таблице Стьюдента для двухсторонней области с уровнем значимости и (n-2) степенями свободы.
|
|
Если - нет оснований отвергнуть гипотезу, если - гипотезу отвергаем.
Порядок выполнения работы:
1. Изучить теоретические сведения по теме.
2. Выполнить задания № 1 -№3 , используя заданные преподавателем статистические данные.
3. Оформить отчет.
Задание 1. По второй тройке столбцов X, Y, Z выборки C построить корреляционные поля для двумерных выборок XY, XZ, YZ,используя Мастер диаграмм табличногопроцессора EXCEL. Вычислить выборочный коэффициент корреляции для каждой двумерной выборки и проверить его значимость при a=0,05. Оценить степень линейной зависимости между соответствующими случайными величинами.
Задание 2. По выборке C составить корреляционную таблицу для двумерной выборки YZ, используя заданные при выборке начала и длины интервалов. По виду корреляционной таблицы оценить вид функциональной зависимости между случайными величинами.
Задание 3. По выборке C вычислить выборочный коэффициент корреляции для каждой из двумерных выборок XY, XZ, YZ с использованием инструмента Корреляция Пакета анализа в EXCEL. Сравнить данные полученных корреляционных матриц с выводами ручного счета.
|
|
Решение типовых заданий.
Задание 1. Построить корреляционное поле и корреляционную таблицу для двумерной выборки XZ. Вычислить выборочный коэффициент корреляции и проверить его значимость при a=0,05. Оценить степень линейной зависимости между соответствующими случайными величинами.
Решение: Исходные данные даны в таблице 6.1, корреляционное поле изображено на рис. 6.1:
Табл.6.1.
X | Z |
29 | -59 |
30 | -67 |
30 | -71 |
32 | -65 |
30 | -63 |
30 | -79 |
29 | -63 |
31 | -73 |
30 | -62 |
29 | -73 |
29 | -71 |
29 | -68 |
30 | -68 |
29 | -78 |
28 | -71 |
29 | -63 |
29 | -66 |
27 | -66 |
27 | -58 |
28 | -67 |
32 | -73 |
29 | -73 |
31 | -80 |
33 | -83 |
Рис 6.1. Корреляционное поле двумерной выборки XZ
По расположению точек на корреляционном поле можно сказать, что они располагаются вдоль некоторой «воображаемой» прямой. Из этого следует, что корреляционная связь возможно существует.
Для построения корреляционной таблицы двумерной выборки XZ варианты случайной величины X записываем в первую строку таблицы, а интервалы другой случайной величины Y – в первый столбец и получим таблицу 6.2:
Таблица 6.2.
x z | 27 | 28 | 29 | 30 | 31 | 32 | 33 |
-83 … -78 | 1 | 1 | 1 | 1 | |||
-77… -73 | 11 | 1 | |||||
-72 …-68 | 111 | 11 | 1 | ||||
-67 … - 63 | 1 | 1 | 1111 | 11 | 1 | ||
-62 … -58 | 1 | 1 | 1 |
Так как частоты располагаются вдоль побочной диагонали, следовательно линейная связь существует.
Вычислим выборочный коэффициент двумерной выборки XZ. Для этого составим вспомогательную таблицу 6.3.
Таблица 6.3.
29 | -59 | -1711 | 841 | 3481 |
30 | -67 | -2010 | 900 | 4489 |
30 | -71 | -2130 | 900 | 5041 |
32 | -65 | -2080 | 1024 | 4225 |
30 | -63 | -1890 | 900 | 3969 |
30 | -79 | -2370 | 900 | 6241 |
29 | -63 | -1827 | 841 | 3969 |
31 | -73 | -2263 | 961 | 5329 |
30 | -62 | -1860 | 900 | 3844 |
29 | -73 | -2117 | 841 | 5329 |
29 | -71 | -2059 | 841 | 5041 |
29 | -68 | -1972 | 841 | 4624 |
30 | -68 | -2040 | 900 | 4624 |
29 | -78 | -2262 | 841 | 6084 |
28 | -71 | -1988 | 784 | 5041 |
29 | -63 | -1827 | 841 | 3969 |
29 | -66 | -1914 | 841 | 4356 |
27 | -66 | -1782 | 729 | 4356 |
27 | -58 | -1566 | 729 | 3364 |
28 | -67 | -1876 | 784 | 4489 |
32 | -73 | -2336 | 1024 | 5329 |
29 | -73 | -2117 | 841 | 5329 |
31 | -80 | -2480 | 961 | 6400 |
33 | -83 | -2739 | 1089 | 6889 |
710 | -1660 | -49216 | 21054 | 115812 |
=
= » -0,48
Проверяем значимость выборочного коэффициента корреляции. Вычисляем наблюдаемое значение критерия:
. Критическую точку находим по таблице критических точек Стьюдента для двусторонней области при уровне значимости a=0,05 и числу степеней свободы df=24-2=22. Получаем . Поскольку , то нулевую гипотезу отвергаем. Другими словами, выборочный коэффициент корреляции значимо отличается от нуля, т.е. X и Z коррелированы.
Оценим степень линейной зависимости между соответствующими случайными величинами.
Так как , то линейная связь отрицательна, а из того, что следует что линейная корреляционная связь слабая и, возможно, существует нелинейная зависимость между случайными величинами.
Примечания: 1) Для вычисления выборочного коэффициента корреляции можно использовать инструмент Корреляция Пакета анализа табличного процессора Excel ( см. рис 6.2,6.3).
Рис.6.2
Рис.6.3.
Для нахождения коэффициента корреляции можно также можно использовать статистическую функцию (рис.6.4) .
Рис.6.4.
Для нахождения можно воспользоваться таблицей Стьюдента или статистической функцией .
2). Для построения корреляционного поля с помощью табличного процессора Excel надо вызвать Мастер диаграмм и выбрать тип Точечная. На вкладке Легенда снимаем флажок Добавить легенду. На вкладке Заголовки в поле Название диаграммы напишем Корреляционное поле, в поле ось Х напишем Х, в поле ось Y напишем Z.
Корреляционное поле, полученное по исходным данным, изображено на рис.6.5.
Рис 6.5. Корреляционное поле.
Содержание отчета.
Отчёт о полученных результатах должен содержать:
ü Тему и цель лабораторной работы;
ü формулировку задания с указанием варианта;
ü решения заданий, в которых результаты вычислений должны быть оформлены в таблицы;
ü результаты вычислений, произведенные в табличном процессоре Excel;
ü выводы.
Контрольные вопросы.
- Для чего используется корреляционный анализ?
- Какая зависимость между случайными величинами называется корреляционной?
- Как строится корреляционное поле?
- Что такое корреляционная таблица?
- Как определяется коэффициент корреляции и в чем его смысл?
- Какие свойства выборочного коэффициента корреляции?
- Как проверить значимость выборочного коэффициента корреляции?
- Какое средство табличного процессора Excel используется для количественной оценки взаимосвязи двух наборов данных?
Лабораторно-практическая работа №7
Дата добавления: 2018-04-05; просмотров: 855; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!