Методы выявления наличия связи



Для выявления наличия связи, ее характера и направления в статистике используются следующие методы: приведения параллельных данных; графический; аналитических группировок; корреляции, регрессии.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Основные этапы построения аналитической группировки следующие:

1) обоснование и выбор факторного и результативного признаков;

2) группировка единиц совокупности по факторному признаку;

3) подсчет числа единиц в каждой из образованных групп, а также определение объема варьирующих признаков в пределах созданных групп;

4) исчисление средних размеров результативного признака по каждой из образованных групп;

5) оформление результатов группировки в таблице;

6) сопоставление изменения значений факторного и результативного признаков, определяющее характер связи между ними, т.е. выявление взаимосвязи между признаками, когда с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.

Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии. Знаки при коэффициентах корреляции характеризуют направление связи между признаками.

В статистике принято различать следующие виды зависимостей:

1) Парная корреляция – связь между двумя признаками (результативным и факторным, или двумя факторными).

2) Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3) Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

Регрессия тесно связана с корреляцией и позволяет исследовать аналитическое выражение взаимосвязи между признаками. Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).

 

Парная регрессия

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным. Аналитически связь между признаками может быть описана следующими уравнениями:

- прямой: y = a + bx;

- параболы: y = a + bx + cx2;

- гиперболы: и др.

Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

.

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

,

где n – объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр a показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии b показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.

Теснота связи количественно выражается величиной коэффициента корреляции, который характеризует степень линейной зависимости между двумя переменными. В статистической теории разработаны и на практике применяются различные модификации формул расчета линейного коэффициента корреляции, например:

.

Свойства коэффициента корреляции.

1) Коэффициент корреляции изменяется в пределах от –1 до +1: –1 ≤ r ≤ 1. Чем ближе | r | к единице, тем теснее связь.

2) При r = ± 1 связь между величинами линейная.

3) При r = 0 линейная связь между величинами отсутствует.

4) При r > 0 связь между величинами положительная (прямая), т.е. с увеличением (уменьшением) x соответственно увеличивается (уменьшается) y.

5) При r < 0 связь между величинами отрицательная (обратная), т.е. с увеличением x уменьшается y и наоборот.

 

Пример

Проанализировать взаимосвязь между себестоимостью и выпуском продукции (табл. 12.1)/

 

Таблица 12.1 – Данные о выпуске продукции и себестоимости

Выпуск продукции, тыс. шт. (xi) Себестоимость, тыс. руб. (yi)
    1,9
    1,7
    1,8
    1,6
    1,4
Итого   8,4

 

Предположим наличие линейной зависимости между рассматриваемыми признаками. Построим расчетную таблицу для определения параметров линейного уравнения регрессии (табл. 12.2)

 

Таблица 12.2 – Расчет параметров линейного уравнения регрессии и коэффициента корреляции

i xi yi xi2 xiyi yi2
    1,9   3,8 1,9 3,61
    1,7   5,1 1,79 2,89
    1,8   7,2 1,68 3,24
    1,6     1,57 2,56
    1,4   8,4 1,46 1,96
Итого   8,4   32,5 8,4 14,26

 

Система нормальных уравнений для данного примера имеет вид:

;

;

;

.

Изобразим фактические и расчетные значения на графике (рис. 12.1).

Рис. 12.1. Взаимосвязь между выпуском продукции и себестоимостью

Рассчитаем величину коэффициента корреляции:

.

Полученное значение коэффициента корреляции свидетельствует о том, что между выпуском продукции и себестоимостью существует обратная (отрицательная) зависимость (r < 0); эта зависимость сильная (r > 0,7).

 


Дата добавления: 2016-01-03; просмотров: 13; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!