Линейная корреляция и регрессия количественных признаков



    Такая зависимость выражается уравнением прямой линии Y = a + bX,        где Y - значение функции, a – ордината линии, b – коэффициент регрессии, X – значение аргумента.

    Для характеристики тесноты (силы) и направления линейной корреляции используется коэффициент корреляции, который рассчитывается по формуле

,

где Х и Y – исходные значения коррелирующих признаков;

х и y – средние арифметические значения;

n – число независимых парных наблюдений.

 

    Коэффициент корреляции может варьировать от +1 до -1. Если коэффициент корреляции положительный, то связь прямая, если отрицательный – обратная.

 

    При r < 0,3 – корреляция слабая, при r = 0,3-0,7 – средняя, при r > 0,7 – сильная.

    Ошибку коэффициента корреляции вычисляют по формуле

.

    Достоверность корреляции оценивается по критериям существенности: фактическому trф и теоретическому t05 или t01 (берут из таблицы А.1 Приложений для n = 2 степеней свободы).

.

    Если trф < t05, то корреляционная связь несущественная, а когда trф ≥ t05 – существенная.

 

    Квадрат коэффициента корреляции называется коэффициентом детерминации r2 = dYX и показывает долю (%) изменчивости, обусловленную действием изучаемого фактора.

Например, при r = 0,3 dYX = 0,32 = 0,09 доли, или 9%;

при r = 0,7 dYX = 0,72 = 0,49 доли, или 49%;

при r = 0,9 dYX = 0,92 = 0,81 доли, или 81%.

 

    Коэффициенты корреляции и детерминации показывают направление и степень влияния, но не дают представления, как количественно меняется результативный признак при изменении на единицу измерения факториального признака. Для этого используют коэффициент регрессии, который рассчитывают по формулам:

     


 ,      .

        

Коэффициент регрессии bYX показывает, как изменяется Y при изменении Х на единицу измерения, и выражается в единицах Y, а bYX (икс по игреку) – как изменяется Х при изменении Y на единицу, в единицах измерения Х.

    При односторонней зависимости, например, урожайности (Y) от количества внесенных удобрений (Х), вычисляют только коэффициент регрессии bYX, т.к. вычисление обратной зависимости лишено смысла.

    При 2-сторонней зависимости, например, высоты растений (Х) и длины колоса (Y), вычисляют оба коэффициента регрессии.

    Коэффициенты регрессии имеют знаки коэффициентов корреляции. Произведение коэффициентов регрессии равно квадрату коэффициента корреляции, т.е. равно коэффициенту детерминации:

.

    Ошибки коэффициентов регрессии вычисляют по формулам:

 


,       .

        

Существенность регрессии оценивают по критериям существенности: фактическому tвф и теоретическому на 5%-ом и 1%-ом уровне значимости t05 или t01 (берут из таблицы А.1 Приложений для n = 2 степеней свободы).

    Если tвф < t05 - регрессия несущественная, а когда tвф ≥ t05 – существенная.

    Корреляция изображается графически в виде прямой линии регрессии, которая проводится по точкам пересечения признака Х, значения которого складываются по оси абсцисс, и признака Y, значения которого складываются по оси ординат. Линия регрессии соответствует значениям Х и Y и имеет наклон, определяемый в единицах Y на единицу Х.

    Точки пересечения Х, Y часто имеют сильный разброс. Чтобы устранить влияние случайных отклонений и найти теоретическое положение прямой линии регрессии, ее выравнивают графически или аналитически. При графическом способе прямая линия проводится примерно по середине точек разброса. При аналитическом способе положение прямой линии рассчитывается по уравнению Y = a + b х как линии, соединяющей теоретически усредненные значения Y и Х для двух крайних значений ряда Х. Найденные точки (Хmin, Ymin и Хmax, Ymax) наносят на график и соединяют линией теоретической регрессии Y по Х.

 

Таблица 13 – Расчет вспомогательных величин для определения линейной корреляции и регрессии между высотой растений (Х) и длиной колоса (Y)

 

Значение признаков, см

Отклонение от средней, см

Квадраты отклонений

Произведение отклонений
Х Y X – x Y – y (X – x)2 (Y – y)2 (X – x)(Y – y)
             
             
             
             
             
             
             
             
             
             

Суммы

ΣХ = ΣY = Σ(X – x) = Σ(Y-y) = Σ(X – x)2 = Σ(Y-y)2 = Σ(X–x)(Y–y)=

 

Средние показатели признаков:

n = 10 растений;

х = ΣХ : n =                         ; y = ΣY: n =

Ошибки средних:

                                      ;

                                        .

Коэффициент корреляции:

                                     .

Ошибка коэффициента корреляции:

                                               .

Критерий существенности фактический:

                                                    ;

t05 теор. – критерий Стьюдента для степеней свободы n – 2 =                       ;

t05 теор. =           ;

t rфакт. _____ > t05 теор. _____.

    Критерий существенности показывает, что теоретическое значение меньше фактического. Так, корреляционная зависимость между высотой растений и длиной колоса существенная, т.е. достоверная.

        

Когда r < 0,3 – зависимость слабая;

                  r = 0,3-0,7 – зависимость средняя;

                  r > 0,7 – зависимость сильная.

 

    Коэффициент регрессии для длины колоса:

                                 см.

    Коэффициент регрессии для высоты растения:

                                 см.

    Проверка расчетов:

                                 .

 

 

Рисунок 1 – График корреляционной зависимости

 

Заключение:

 

1. Между высотой растений и длиной колоса имеется сильная существенная прямолинейная корреляция.

2. С изменением высоты растений на 1 см длина колоса изменяется на ________ см (на это указывает коэффициент регрессии для длины колоса).

3. С изменением длины колоса на 1 см высота растений изменятся на ________ см (на это показывает коэффициент регрессии для высоты растения).

 


Дата добавления: 2019-09-13; просмотров: 214; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!