Интерпретация коэффициента корреляции: значимость



Для проверки значимости коэффициента парной корреляции нужно сравнить его значение с табличным (критическим) значением r, которое приведено в таблице 3. Для пользования этой таблицей нужно знать число степеней свободы f = N – 2 и выбрать определенный уровень значимости, например равный 0,05. Такое значение уровня значимости называют еще 5%-ным уровнем риска, что соответствует вероятности верного ответа при проверке нашей гипотезы Р = 1 – α = 0,95, или 95%. Это значит, что в среднем только в 5% случаев возможна ошибка при проверке гипотезы.

В практических исследованиях 5%-ный уровень риска применяется наиболее часто. Но экспериментатор всегда свободен в выборе уровня значимости, и возможны ситуации, в которых, например, требуется 1%-ный уровень риска. При этом возрастает надежность ответа. Проверка гипотезы сводится к сравнению абсолютной величины коэффициента парной корреляции с критическим значением. Если экспериментально найденное значение r меньше критического, то нет оснований считать, что имеется тесная линейная связь между параметрами, а если больше или равно, то гипотеза о корреляционной линейной связи не отвергается

Интерпретация коэффициента корреляции: сила связи

Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Максимальное воз­можное абсолютное значение коэффициента корреляции r=1,00; мини­мальное r=0.

Используется две системы классификации корреляционных связей по их силе: общая и частная. Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992):

1) сильная, или тесная при коэффициенте корреляции r>0,70;

2) средняя при 0,50<r<0,69;

3) умеренная при 0,30<r<0,49;

4) слабая при 0,20<r<0,29;

5) очень слабая при r<0,19.

Частная классификация корреляционных связей:

1) высокая значимая корреляция при г, соответствующем уровню статистической значимости р<0,01;

2) значимая корреляция при г, соответствующем уровню статистической значимости р<0,05;

3) тенденция достоверной связи при г, соответствующем уровню статистической значимости р<0,10;

4) незначимая корреляция при г, не достигающем уровня статистической значимости .

Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, Тем меньшей величины коэффициента корреляции оказывается доста­точно, чтобы корреляция была признана достоверной. В результате при Малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки Даже слабая корреляция может оказаться достоверной.

Обычно принято ориентироваться на вторую классификацию, по­скольку она учитывает объем выборки. Вместе с тем, необходимо пом­нить, что сильная, или высокая, корреляция - это корреляция с коэффи­циентом r>0,70, а не просто корреляция высокого уровня значимости.

Интерпретация коэффициента корреляции: направление связи

По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака - низкие значения другого. При отрицательной корреляции соотношения обратные.

При положительной корреляции коэффициент корреляции имеет положительный знак, например r=+0,207, при отрицательной корреля­ции - отрицательный знак, например r=—0,207.

 

Коэффициенты корреляции Пирсона и Спирмена

Коэффициент корреляции Пирсона – это наиболее часто употребляемый метод измерения корреляции. Встречается название «коэффициент линейной корреляции Пирсона», которое отражает принцип работы данного метода. Данный коэффициент показывает, насколько близко находятся точки графика рассеяния к прямой линии (прямой регрессии), проведенной через центральною часть их скопления так, чтобы сумма квадратов расстояний от точек до нее была минимальна. Чем ближе точки к прямой регрессии, тем выше корреляция. Корректное использование данного коэффициента возможно только в случае, когда переменные измерены в интервальной или относительной шкалах.

Требования к выборке:

· Объем выборки исследования: для использования r-Пирсона объем выборки n1≥30 и n2≥30;

· Распределение: для использования r-Пирсона должно соответствовать нормальному виду.

Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Коэффициент корреляции Спирмена— мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги.

Преимущество r-Спирмена по сравнению с r-Пирсона – в большей чувствительности к связи в следующих случаях:

· существенного отклонения распределения хотя бы одной переменной от нормального вида (асимметрия, выбросы);

· криволинейной (монотонной) связи.

Ограничением для применения коэффициента rs–Спирмена является:

· по каждой переменной не менее 5 наблюдений;

· коэффициент при большом количестве одинаковых рангов по одной или обеим переменным дает огрубленное значение.


Статистические гипотезы

Статистическая гипотеза - представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки.

Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае – параметрическими.

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0.

Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.

Различают простые и сложные гипотезы. Гипотезу называют простой, если она однозначно характеризует параметр распределения случайной величины. Например, если l является параметром экспоненциального распределения, то гипотеза Н0 о равенстве l =10 – простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н0 о неравенстве l > 10 состоит из бесконечного множества простых гипотез Н0 о равенстве l =bi , где bi – любое число, большее 10. Гипотеза Н0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.

Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно.


Дата добавления: 2018-08-06; просмотров: 13143; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!