Тема 4. Анализ взаимосвязи явлений

Статистические методы определения взаимосвязи социально-экономических явлений

· Дисперсионный анализ;

· Корреляционно-регрессионный анализ;

· Непараметрические методы определения взаимосвязи

Выбор метода анализа взаимосвязи зависит от того, характера анализируемых признаков.

5.1. Дисперсионный анализ

Дисперсионный анализ (определение эмпирического коэффициента детерминации) – статистический метод изучения различий между выборочными средними двух или более совокупностей.

Проводиться на основе группировки данных. Группировка может проводиться как по количественному так и по качественному признаку. Поэтому подходит для тех случаев, когда результативный признак (зависимая переменная) – количественная дискретная переменная, а факторным признаком является любая переменная (чаще: альтернативная, атрибутивная и интервальная).

Однофакторный дисперсионный анализ включает один факторный признак, многофакторный – два и более факторов.

Алгоритм проведения дисперсионного анализа (расчета эмпирического коэффициента детерминации):

1. Определение общего среднего значения результативного признака.

2. Определение общей дисперсии . Общая дисперсия характеризует изменение значения признака за счет всех факторов, в том числе за счет изменения группировочного признака.

3. Группировка данных по факторному признаку.

4. Определение средних значений по каждой группе.

5. Определение внутригрупповой дисперсии по каждой группе.

6. Определение средней из внутригрупповых дисперсий. Внутри групповая дисперсия характеризует изменение исследуемого признака независимо от изменения группировочного признака.

где: - дисперсия изучаемого признака в i-й группе; - объем (число единиц) i-й группы; - число групп, на которые разделена совокупность

7. Определение межгрупповой дисперсии , которая характеризует изменения значения исследуемого признака за счет действия только группировочного признака.

8. Проверка правильности расчета дисперсий по «правилу сложения дисперсий»

где: - общая дисперсия признака по всей совокупности, без учета деления этой совокупности на группы; - средняя из внутригрупповых дисперсий; - межгрупповая дисперсия.

9. Вычисление эмпирического коэффициента детерминации:

Значение эмпирического коэффициента детерминации лежит в пределах от 0 до 1. Чем данный коэффициент ближе к 1, тем сильней влияние факторного признака на результативный. Эмпирический коэффициент детерминации равен нулю, когда факторный признак не влияет на результативный. Значение эмпирического коэффициента детерминации равно 1, когда внутри каждой из групп изменчивость отсутствует, но имеется изменчивость между группами. Таким образом, эмпирического коэффициента детерминации представляет собой долю вариации результативного признака, которая объясняется влиянием факторного признака.

9. Расчет эмпирического корреляционного отношения. В зависимости от значения эмпирического корреляционного отношения можно определить характер связи.

Значение эмпирического корреляционного отношения	Характеристика связи
0– 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,999	Нет связи Слабая Умеренная Заметная Тесная Почти функциональная Функциональная

5.2. Корреляционно-регрессионный анализ

Используется, только если и результативный, и факторные признаки являются количественными. Состоит из двух частей: корреляционного анализа (результат - отбор факторных признаков, оказывающих наибольшее внимание на исследуемый признак) и регрессионного анализа (результат - построение уравнения, позволяющего количественно описать взаимосвязь).

Корреляционный анализ: выбор факторов [1].

Анализ взаимосвязей начинают с построения графика, который получил название поле корреляции, где каждая единица совокупности представлена в виде отдельной точки. Совокупность точек формирует графический образ, позволяющий оценить форму и направление связи.

Виды взаимосвязи экономических показателей.

	Прямая	Обратная
Линейная
Нелинейная
Отсутствие связи

1 шаг. Определение парных коэффициентов корреляции, характеризующих парную линейную зависимость.

Парный коэффициент корреляции - мера линейной зависимости между двумя переменными на фоне действия остальных переменных, входящих в модель.

Парный коэффициент корреляции изменяется в пределах от -1 до 0 (обратная зависимость - рост факторного признака влечет снижение значения зависимого признака) и от 0 до +1 (прямая зависимость - рост факторного признака сопровождается ростом зависимого признака). При этом, чем ближе коэффициент корреляции по модулю к 1, тем ближе точки на поле корреляции расположены к линии и тем сильнее связь.

Интерпретация значений:

Значение коэффициента корреляции	Сила связи
до	практически отсутствует
	слабая
	средняя
	сильная

В многофакторном анализе рассчитывают все возможные парные коэффициенты корреляции и представляют в виде корреляционной таблицы (корреляционной матрицы).

При этом существенный интерес вызывает не только коэффициент корреляции между зависимым и факторными признаками, но и коэффициенты корреляции между факторными признаками. Наличие между ними существенной связи (r>0,8) говорит о мультикаллинеарности. В случае мультиколлинеарности при построении регрессии может использоваться только один из взаимосвязанных факторов.

2 шаг. Проверка значимости коэффициентов корреляции.

а) выдвигается гипотеза о равенстве нулю коэффициента корреляции;

б) рассчитывается величина:

в) по таблице значений t-критерия Стьюдента находится значение t_крит, соответствующее числу степеней свободы и уровню значимости α.

г) если │t_{расчет│}> t _крит, то гипотеза о нулевом коэффициенте корреляции отклоняется и соответственно, корреляционное коэффициент считается значимым. В идеале в регрессионном анализе должны участвовать только факторы, оказывающие значимое влияние на результативный признак.

3 шаг. Расчет частного коэффициента корреляции, который характеризует тесноту линейной зависимости между двумя переменными независимо от влияния на них остальных переменных.

4 шаг. Проверка значимости частных коэффициентов корреляции по критерию Стьюдента. Единственным отличием является число степеней свободы , l – число фиксируемых факторов.

5 шаг. Определение множественного коэффициента корреляции, определяющего тесноту связи между зависимым признаком и совокупностью всех факторных признаков.

6 шаг. Определение множественного коэффициента детерминации , который показывает, какая доля дисперсии результативного признака объясняется влиянием факторных признаков.

7 шаг. Проверка значимости множественного коэффициента детерминации проводится по F-критерию.

После определения наиболее значимых факторов проводится регрессионный анализ, результатом которого является построение модели явления.

Регрессионный анализ: линейная зависимость

Если имеется только один факторный признак, строиться парная регрессия:

где: - теоретические (расчетные) значения результативного признака; - фактические значения факторного признака; и - параметры модели.

Параметры регрессионной модели определяются на основе метода наименьших квадратов из системы уравнений:

где: - объем совокупности (число наблюдений).

Коэффициент определяет некоторые начальные условия, а так же совокупное влияние неучтенных в модели факторов. Коэффициент регрессии показывает на какую величину в среднем измениться результативный признак У, если переменную Х увеличить на единицу ее собственного измерения.

На основе уравнения регрессии можно найти коэффициент эластичности для факторного признака Х_j, который показывает, на сколько процентов в среднем изменится величина результативного показателя при изменении показателя X_j на 1%, можно найти по следующей формуле.

Значимость линейного уравнения проверяется с помощью F-критерия или P-значения.

Критическое значение F-критерия находится по таблице F-распределения для степеней свободы: , . Если F_набл> F_крит, то уравнение значимо.

P-значение характеризует вероятность ошибки утверждения, что факторный признак(признаки) значимо влияет на результативный показатель. Величина P не должна превышать определенный порог. Обычно этот порог устанавливается исследователем на уровне 5% (0,05), если речь идет о маркетинговых, управленческих, социальных исследованиях, и на уровне 1%, если говориться о финансовых моделях и риск-менеджменте.

Регрессионный анализ: нелинейная зависимость

Для моделирования нелинейной зависимости подбирается нелинейная функция, соответствующая форме изучаемой связи, например гипербола:

Параметры данной регрессионной модели определяются на основе метода наименьших квадратов из системы уравнений:

Анализ зависимости аналогичен линейной зависимости.

Дата добавления: 2015-12-17; просмотров: 19; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 Следующая ⇒

Мы поможем в написании ваших работ!