Лабораторно-практическая работа №6



 Корреляционный анализ.

Цель работы: приобретение навыков оценки взаимозависимости между случайными величинами по выборочным данным с помощью корреляционных полей, корреляционных таблиц и выборочных коэффициентов корреляции.

Краткие теоретические сведения.

Основной задачей корреляционного анализа является выявление тесноты связи между случайными величинами X и Y и количественная оценка тесноты этой связи.

Две случайные величины могут быть независимыми, либо связанные функциональной зависимостью (крайне редко), либо стохастической зависимостью.

Стохастическойназывают зависимость, при которой изменение одной из случайных величин влечет изменение распределения другой. Если стохастическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой, то такая зависимость называется корреляционной. Корреляционная зависимость между переменными величинами – это та функциональная зависимость, которая существует между значениями одной из них и групповыми средними другой. Определение корреляционной связи между случайными величинами можно осуществлять с помощью наглядных (предварительных) и расчетных методов. К наглядным методам относится построение корреляционных полей или корреляционных таблиц. К расчетным – вычисление выборочного коэффициента корреляции, который характеризует степень линейной функциональной зависимости между случайными величинами X и Y. 

Корреляционное поле.

Пусть получена двумерная выборка:

 

 

На плоскости отмечаем точки с координатами

Если эти точки ложатся в форме шара или подковы, то линейная корреляция отсутствует. Если они ложатся вдоль воображаемой прямой, то корреляционная связь существует.

Корреляционные таблицы.

Варианты или интервалы значений одной случайной величины записывают в первую строку корреляционной таблицы, а варианты или интервалы другой случайной величины – в первый столбец. 

 
       
       
       
       

 

 

 

 

 

По каждой паре значений ( ) выборки определяют в какую клетку таблицы она попадает. Если частоты располагаются вдоль главной или побочной диагоналей, то присутствует линейная корреляция.

 Коэффициент корреляции.

Основной оценкой тесноты линейной связи между случайными величинами служит выборочный коэффициент корреляции rв, который для несгруппированных данных вычисляется по формуле:

или

Свойства коэффициента корреляции:

1.  Выборочный коэффициент корреляции удовлетворяет неравенству ;

2. Если , то связь положительна, если , то связь отрицательна;

3. Если , то между и существует функциональная линейная зависимость;   

4. Чем ближе  к 1, тем теснее линейная связь между случайными величинами;

5. Если , то и, возможно, существует нелинейная связь между случайными величинами.

  6. Если = 0, то случайные величины независимы, при условии что они имеют нормальное распределение.

Выборочный коэффициент корреляции, является оценкой коэффициента корреляции  генеральной совокупности.

Допустим, что выборочный коэффициент корреляции оказался отличным от нуля, т.е. . Поскольку выборка случайна, то надо проверить гипотезу о значимости выборочного коэффициента корреляции (или о равенстве нулю коэффициента корреляции  генеральной совокупности). Если гипотеза о равенстве нулю коэффициента корреляции  генеральной совокупности будет отвергнута, то выборочный коэффициент корреляции значим, а СВ X и Y коррелированы.

 Проверяем нулевую гипотезу

 при альтернативной    

Для проверки задаем уровень значимости  и критерий:

Если верна гипотеза , то критерий  имеет распределение Стьюдента с (n-2) степенями свободы. Строим двухстороннюю критическую область. Критическую точку ищем по таблице Стьюдента для двухсторонней области с уровнем значимости  и (n-2) степенями свободы.

Если  - нет оснований отвергнуть гипотезу, если  - гипотезу отвергаем.

Порядок выполнения работы:

1. Изучить теоретические сведения по теме.

2. Выполнить задания № 1 -№3 , используя заданные преподавателем статистические данные.

3. Оформить отчет.

 

Задание 1. По второй тройке столбцов X, Y, Z выборки C построить корреляционные поля для двумерных выборок XY, XZ, YZ,используя Мастер диаграмм табличногопроцессора  EXCEL. Вычислить выборочный коэффициент корреляции для каждой двумерной выборки и проверить его значимость при a=0,05. Оценить степень линейной зависимости между соответствующими случайными величинами.

Задание 2. По выборке C составить корреляционную таблицу для двумерной выборки YZ, используя заданные при выборке начала и длины интервалов. По виду корреляционной таблицы оценить вид функциональной зависимости между случайными величинами.

Задание 3. По выборке C вычислить выборочный коэффициент корреляции для каждой из двумерных выборок XY, XZ, YZ   с использованием инструмента Корреляция Пакета анализа в EXCEL. Сравнить данные полученных корреляционных матриц с выводами ручного счета.

 Решение типовых заданий.

 

Задание 1.  Построить корреляционное поле и корреляционную таблицу для двумерной выборки XZ. Вычислить выборочный коэффициент корреляции и проверить его значимость при a=0,05. Оценить степень линейной зависимости между соответствующими случайными величинами.  

Решение: Исходные данные даны в таблице 6.1, корреляционное поле изображено на рис. 6.1:

Табл.6.1.                  

X Z
29 -59
30 -67
30 -71
32 -65
30 -63
30 -79
29 -63
31 -73
30 -62
29 -73
29 -71
29 -68
30 -68
29 -78
28 -71
29 -63
29 -66
27 -66
27 -58
28 -67
32 -73
29 -73
31 -80
33 -83

Рис 6.1. Корреляционное поле двумерной выборки XZ

По расположению точек на корреляционном поле можно сказать, что они располагаются вдоль некоторой «воображаемой» прямой. Из этого следует, что корреляционная связь возможно существует.

  Для построения корреляционной таблицы двумерной выборки XZ  варианты случайной величины X записываем в первую строку таблицы, а интервалы другой случайной величины Y – в первый столбец и получим таблицу 6.2: 

 

Таблица 6.2.

x z 27 28 29 30 31 32 33
-83 … -78     1 1 1   1
-77… -73     11     1  
-72 …-68     111 11 1    
-67 … - 63 1 1 1111 11   1  
-62 … -58 1   1 1      

Так как частоты располагаются вдоль побочной диагонали, следовательно линейная связь существует.

Вычислим выборочный коэффициент двумерной выборки XZ. Для этого составим вспомогательную таблицу 6.3.

Таблица 6.3.

29 -59 -1711 841 3481
30 -67 -2010 900 4489
30 -71 -2130 900 5041
32 -65 -2080 1024 4225
30 -63 -1890 900 3969
30 -79 -2370 900 6241
29 -63 -1827 841 3969
31 -73 -2263 961 5329
30 -62 -1860 900 3844
29 -73 -2117 841 5329
29 -71 -2059 841 5041
29 -68 -1972 841 4624
30 -68 -2040 900 4624
29 -78 -2262 841 6084
28 -71 -1988 784 5041
29 -63 -1827 841 3969
29 -66 -1914 841 4356
27 -66 -1782 729 4356
27 -58 -1566 729 3364
28 -67 -1876 784 4489
32 -73 -2336 1024 5329
29 -73 -2117 841 5329
31 -80 -2480 961 6400
33 -83 -2739 1089 6889
710 -1660 -49216 21054 115812

=

=  » -0,48

 Проверяем значимость выборочного коэффициента корреляции. Вычисляем наблюдаемое значение критерия:

. Критическую точку находим по таблице критических точек Стьюдента для двусторонней области при уровне значимости a=0,05 и числу степеней свободы df=24-2=22. Получаем . Поскольку , то нулевую гипотезу отвергаем. Другими словами, выборочный коэффициент корреляции значимо отличается от нуля, т.е. X и Z коррелированы.

   Оценим степень линейной зависимости между соответствующими случайными величинами.  

Так как , то линейная связь отрицательна, а из того, что   следует что линейная корреляционная связь слабая и, возможно, существует нелинейная зависимость между случайными величинами.  

 

Примечания: 1) Для вычисления выборочного коэффициента корреляции можно использовать инструмент Корреляция Пакета анализа табличного процессора Excel ( см. рис 6.2,6.3).

 

Рис.6.2

Рис.6.3.

Для нахождения коэффициента корреляции можно также можно использовать статистическую функцию   (рис.6.4) .

 

                      Рис.6.4.

Для нахождения можно воспользоваться таблицей Стьюдента или статистической функцией .

2). Для построения    корреляционного поля с помощью табличного процессора Excel надо вызвать Мастер диаграмм и выбрать тип Точечная. На вкладке Легенда снимаем флажок Добавить легенду. На вкладке Заголовки в поле Название диаграммы напишем Корреляционное поле, в поле ось Х напишем Х, в поле ось Y напишем Z.

Корреляционное поле, полученное по исходным данным, изображено на рис.6.5.

                

Рис 6.5. Корреляционное поле.

Содержание отчета.

Отчёт о полученных результатах должен содержать:

ü Тему и цель лабораторной работы;

ü формулировку задания с указанием варианта;

ü решения заданий, в которых результаты вычислений должны быть оформлены в таблицы;

ü результаты вычислений, произведенные в табличном процессоре Excel;

ü выводы.

 

Контрольные вопросы.

  1. Для чего используется корреляционный анализ?
  2. Какая зависимость между случайными величинами называется корреляционной?
  3. Как строится корреляционное поле?
  4. Что такое корреляционная таблица?
  5. Как определяется коэффициент корреляции и в чем его смысл?
  6. Какие свойства выборочного коэффициента корреляции?
  7. Как проверить значимость выборочного коэффициента корреляции?
  8. Какое средство табличного процессора Excel используется для количественной оценки взаимосвязи двух наборов данных?

 

Лабораторно-практическая работа №7


Дата добавления: 2018-04-05; просмотров: 855; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!