Значения t-критерия Стьюдента при уровне значимости



Практика №1 по дисциплине

«Моделирование и прогнозирование социально-экономических процессов»

«Корреляционный анализ»

Основная задача корреляционного анализа - выявление взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации.

С помощью корреляционного анализа решаются следующие задачи:

- отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними;

- обнаружение ранее неизвестных причинных связей.

Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии.

ковариация - это статистическая мера взаимодействия двух случайных переменных, таких, например, как доходности двух ценных бумаг. Положительное значение ковариации показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону.

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Ковариация между двумя переменными рассчитывается следующим образом:

                 ,

где  - фактические значения случайных переменных x и y,

. .

Ковариация зависит от единиц, в которых измеряются переменные .

Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции.

При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n –наблюдений; хik – i-ое наблюдение k-ой переменной.

Основными средствами анализа данных являются:

- парные коэффициенты корреляции,

- частные коэффициенты корреляции,

- множественные коэффициенты корреляции.

Коэффициент парной корреляции

Для двух переменных теоретический коэффициент корреляции определяется следующим образом:

,

где - дисперсии случайных переменных , а  их ковариация.

Парный коэффициент корреляции является показателем тесноты связи лишь в случае линейной зависимости между переменнымии обладает следующими основными свойствами:

- Коэффициент корреляции принимает значение в интервале (-1,+1), или |rxy| < 1.

- Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т.е.

r1X+β; α2Y+β)= rxy,

где α1, α2, b - постоянные величины, причем α1>0, α2>0.

 

Случайные величины Х, Y, можно уменьшать (увеличивать) в α раз, а также вычитать или прибавлять к значениям одно и тоже число β - это не приведет к изменению коэффициента корреляции r.

При r = ±1 случайные величины связаны линейной зависимостью, т.е. .

При r = 0 линейная корреляционная связь отсутствует.

В практических расчетах коэффициент корреляции r генеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции r, так как выборочная совокупность переменных случайна, то в отличие от параметра r , r – случайная величина. Оценкой коэффициента корреляции  является выборочный парный коэффициент корреляции:

= , (1)

                    

где        - оценки дисперсий величин .

 

Для оценки значимости коэффициента корреляции применяет­ся t - критерий Стьюдента:

- Фактическое значение этого критерия определяется по формуле:

 

                                                                        (2)

 

- Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.

- Если tнабл > tкр, то полученное значение коэффициента корре­ляции признается значимым (то есть нулевая гипотеза, утвер­ждающая равенство нулю коэффициента корреляции, отвергается). Делается вывод о том, что между исследуемыми перемен­ными есть тесная статистическая взаимосвязь.

- Если значение  близко к нулю, связь между переменными слабая. 

- Если случайные величины связаны положительной корреляцией, это означает, что при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать.

- Если случайные величины связаны отрицательной корреляцией, это означает, что при возрастании одной случайной величины, другая имеет тенденцию в среднем убывать.

Коэффициенты парной корреляции используются для измерения силы линейных связей различных пар признаков из их множества. Для множества m признаков n наблюдений получают матрицу коэффициентов парной корреляции R.

                                                                                                (3)

 

Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим, в многомерном корреляционном анализе рассматривается две задачи:

1. Определение тесноты связи одной случайной величины с совокупностью остальных (m – 1) величин, включенных в анализ;

2. Определение тесноты связи между величинами при фиксировании или исключении влияния остальных k величин, при k<(m-2).

Эти задачи решаются с помощью коэффициентов множественной и частной корреляции, соответственно.

 

Множественный коэффициент корреляции

Решение первой задачи осуществляется с помощью выборочного коэффициента множественной корреляции по формуле

          ,                                                                             (4)

где  - определитель корреляционной матрицы R (3);

   - алгебраическое дополнение элемента rjj той же матрицы R.

 

Квадрат коэффициента множественной корреляции  принято называть выборочным множественным коэффициентом детерминации, который показывает, какую долю вариации (случайного разброса) исследуемой величины Хj объясняет вариация остальных случайных величин X1 , X2 , . . . , Xm.

 - Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1.

- При приближении коэффициента R2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении.

- Коэффициент множественной корреляции может только увеличиваться, если в модель включать дополнительные переменные и не увеличится, если из имеющихся признаков производить исключение.

- Проверка значимости коэффициента множественной корреляции осуществляется путем сравнения расчетного значения критерия Фишера:

                                 ,                                                         (5)

с табличным Fтабл. Табличное значение критерия определяется заданным уровнем значимости  и степенями свободы  и .

- Коэффициент R2 значимо отличается от нуля, если выполняется неравенство

                                                             .

 

Частный коэффициент корреляции

Если рассматриваемые случайные величины коррелируют друг с другом, то на величине коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между величинами при исключении влияния одной или нескольких других случайных величин.

Выборочный частный коэффициент корреляции определяется по формуле:

                            ,                           

где  – алгебраические дополнения к соответствующим элементам матрицы (3).

Частный коэффициент корреляции, так же как и парный коэффициент корреляции изменяется от –1 до +1.

Задача №1 (ПРИМЕР РЕШЕНИЯ)

«Вычисление коэффициентов парной, множественной  и частной корреляции».

В табл. 1. представлена информация об объёмах продаж и затратах на рекламу одной фирмы, а также индекс потребительских расходов за ряд текущих лет.

 

Таблица 1

Объем продаж, тыс. руб.-Y 126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384
Затраты на рекламу - Х1 4 4,8 3,8 8,7 8,2 9,7 14,7 18,7 19,8 10,6 8,6 6,5 12,6 6,5 5,8 5,7
Индекс потребительских расходов, % - X2 100 98,4 101,2 103,5 104,1 107 107,4 108,5 108,3 109,2 110,1 110,7 110,3 111,8 112,3 112,9

 

Требуется:

1. Построить диаграмму рассеяния (корреляционное поле) для переменных «объёмы продаж» и «индекс потребительских расходов».

2. Определить степень влияния индекса потребительских расходов на объёмы продаж (вычислить коэффициент парной корреляции). 

3. Оценить значимость вычисленного коэффициента парной корреляции.

4. Построить матрицу коэффициентов парной корреляции по трем переменным.

5. Найти оценку множественного коэффициента корреляции.

6. Найти оценки коэффициентов частной корреляции.

 

 

Решение

1) Вытянутость облака точек на диаграмме рассеяния вдоль наклонной прямой позволяет сделать предположение о том, что существует некоторая объективная тенденция прямой линейной связи между значениями переменных x- индекс потребительских расходов и y- объёмы продаж.

Диаграмма рассеяния имеет вид, приведенный на рис.1.

 

Рис. 1. Диаграмма рассеяния (корреляционное поле).

 

2) Промежуточные расчеты при вычислении коэффициента корреляции между переменными x- индекс потребительских расходов и y- объёмы продаж приведены в таблице 2.

Средние значения случайных величин Х и Y, которые являются наиболее простыми показателями, характеризующими последовательности  и , рассчитаем по формулам:

.

Дисперсия характеризуют степень разброса значений   ( ) вокруг своего среднего   (  , соответственно)

   

 

 

Стандартные ошибки случайных величин Х и Y рассчитаем по формулам:

 

 

Коэффициент корреляции рассчитаем по формуле (1):

Таблица 2.

Y X
1 126 100 -180,813 -7,231 1307,500 52,291 32693,160
2 137 98,4 -169,813 -8,831 1499,657 77,991 28836,285
3 148 101,2 -158,813 -6,031 957,838 36,376 25221,410
4 191 103,5 -115,813 -3,731 432,125 13,922 13412,535
5 274 104,1 -32,813 -3,131 102,744 9,805 1076,660
6 370 107 63,188 -0,231 -14,612 0,053 3992,660
7 432 107,4 125,188 0,169 21,125 0,028 15671,910
8 445 108,5 138,188 1,269 175,325 1,610 19095,785
9 367 108,3 60,188 1,069 64,325 1,142 3622,535
10 367 109,2 60,188 1,969 118,494 3,876 3622,535
11 321 110,1 14,188 2,869 40,700 8,230 201,285
12 307 110,7 0,188 3,469 0,650 12,032 0,035
13 331 110,3 24,188 3,069 74,225 9,417 585,035
14 345 111,8 38,188 4,569 174,469 20,873 1458,285
15 364 112,3 57,188 5,069 289,869 25,692 3270,410
16 384 112,9 77,188 5,669 437,557 32,135 5957,910
сумма 4909 1715,7 0,000 0,000 5681,994 305,474 158718,438
среднее 306,8125 107,23125          

 

 

3) Оценим значимость коэффициента корреляции. Для этого рассчитаем значение t – статистики по формуле  Табличное значение критерия Стьюдента равно: tтабл (α  = 0,1; k = n – 2 = 14) =1,76 (см. Приложение). Сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. полученное значение коэффициента корреляции значимо.

Таким образом, индекс потребительских расходов оказывает весьма высокое влияние на объёмы продаж.

4) Матрица R коэффициентов парной корреляции, вычисленных по формуле (1) для трех факторов будет иметь вид:

 

    Объем реализации           Затраты на рекламу Индекс потребительских расходов
    1 2 3
Объем реализации           1 1 0,646 0,816
Затраты на рекламу 2 0,646 1 0,273
Индекс потребительских расходов 3 0,816 0,273 1

 

5) Вычисление множественного коэффициента корреляции y c x1 и x2.

 

 - определитель корреляционной матрицы R равен 0,1304. 

 - алгебраическое дополнение 1-го диагонального элемента   той же матрицы R

.

      6) Вычисление коэффициентов частной корреляции.

,

где  алгебраическое дополнение элемента   матрицы R, а    алгебраическое дополнение 2-го диагонального элемента

 

 

.

 

Коэффициенты частной корреляции можно вычислить, используя коэффициенты парной корреляции:

          

 

.

 

 

 

ПРИЛОЖЕНИЕ

Значения t-критерия Стьюдента при уровне значимости

Двухсторонний)

Число степеней свободы k

a

Число степеней свободы k

a

0,10 0,05 0,01 0,10 0,05 0,01
1 6,3138 12,706 63,657 18 1,7341 2,1009 2,8784
2 2,9200 4,3027 9,9248 19 1,7291 2,0930 2,8609
3 2,3534 3,1825 5,8409 20 1,7247 2,0860 2,8453
4 2,1318 2,7764 4,6041 21 1,7207 2,0796 2,8314
5 2,0150 2,5706 4,0321 22 1,7171 2,0739 2,8188
6 1,9432 2,4469 3,7074 23 1,7139 2,0687 2,8073
7 1,8946 2,3646 3,4995 24 1,7109 2,0639 2,7969
8 1,8595 2,3060 3,3554 25 1,7081 2,0595 2,7874
9 1,8331 2,2622 3,2498 26 1,7056 2,0555 2,7787
10 1,8125 2,2281 3,1693 27 1,7033 2,0518 2,7707
11 1,7959 2,2010 3,1058 28 1,7011 2,0484 2,7633
12 1,7823 2,1788 3,0545 29 1,6991 2,0452 2,7564
13 1,7709 2,1604 3,0123 30 1,6973 2,0423 2,7500
14 1,7613 2,1448 2,9768 40 1,6839 2,0211 2,7045
15 1,7530 2,1315 2,9467 60 1,6707 2,0003 2,6603
16 1,7459 2,1199, 2,9208 120 1,6577 1,9799 2,6174
17 1,7396 2,1098 2,8982 ¥ 1,6449 1,9600 2,5758

 


Дата добавления: 2018-04-15; просмотров: 14435; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!