Используя пошаговую множественную регрессию (метод исключения), построим модель формирования цены квартиры за счёт значимых факторов.



Для построения множественной регрессии воспользуемся функцией Регрессия программы Excel, включив в нее все факторы. В результате получаем результативные таблицы, из которых нам необходим t-критерий Стьюдента.

Таблица 1.8.а.

Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 30,45 10,14617717 3,001135 0,004862638
X4 (жилая площадь квартиры) 3,849 0,499544248 7,704503 3,99877E-09
X2 (число комнат в квартире) -28,532 8,441863622 -3,379775 0,00175709
X1 (город области) -36,176 7,070149312 -5,116777 1,05101E-05

Таблица 1.8.б.

Регрессионная статистика

Множественный R 0,913962927
R-квадрат 0,835328231
Нормированный R-квадрат 0,821605584
Стандартная ошибка 21,74863765
Наблюдения 40

Таблица 1.8.в.

Дисперсионный анализ

  df SS MS F Значимость F
Регрессия 3 86378,29447 28792,76482 60,87223598 3,55864E-14
Остаток 36 17028,11663 473,0032397    
Итого 39 103406,4111      

Получаем модель вида:

.

Поскольку <  (4,10 < 60,87), уравнение регрессии следует признать адекватным.

Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-3,38│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-4=36: =1,688.

Поскольку │-3,38│> 1,688 модель следует признать адекватной.

Коэффициент парной корреляции независимых переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) = 0,92. Так как это больше 0,8, следовательно в исходных данных имеется мультиколлинеарность. Чтобы избавиться от мультиколлинеарности из переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) оставим в модели X4, так как он в большей степени связан с зависимой переменной Y(цена квартиры).

Вычисляем новую математическую модель.

Таблица 1.9.а.

Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 21,44848618 11,0838945 1,935103784 0,060649342
X4 (жилая площадь квартиры) 2,297644203 7,921039863 10,28689171 0,000196621
X1(город области) -32,73940067 0,223356507 -4,133220036 2,11022E-12

Таблица 1.9.б.

Регрессионная статистика

Множественный R 0,884916669
R-квадрат 0,783077511
Нормированный R-квадрат 0,771351971
Стандартная ошибка 24,62210392
Наблюдения 40

Таблица 1.9.в.

Дисперсионный анализ

  df SS MS F Значимость F
Регрессия 2 80975,23504 40487,61752 66,78391916 5,26787E-13
Остаток 37 22431,17605 606,2480015    
Итого 39 103406,4111      

Получаем модель вида: .

Поскольку <  (4,10 < 66,78), уравнение регрессии следует признать адекватным.

Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-4,13│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-3=37: = 1,687.

Поскольку │-4,13│> 1,687 модель следует признать адекватной.

Мультиколлинеарность отсутствует.

Оцените качество построенной модели.

а) Для модели  коэффициент детерминации составил 0,78, для модели  он составил 0,683, поскольку чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели, то первая модель является лучшей по данному критерию.

б) Рассчитаем среднюю ошибку аппроксимации:

Для предыдущей модели она составила 30,57.

в) Рассчитаем табличное значение F-критерия Фишера при вероятности 0,05:

=3,25

= 66,78

= 66,78 > =3,25 модель по данному критерию адекватна.

Для оценки значимого фактора полученной математической модели, рассчитаем коэффициенты эластичности,  и  - коэффициенты.

Коэффициент эластичности показывает, насколько процентов изменится результативный признак при изменении факторного признака на 1%:

.

Э X4 = 2,29 *(39,62/93,65) = 1%.

Э X1 = (-32,74) * (0,58/93,65) = - 0,2 %.

То есть с ростом общей площади квартиры на 1% стоимость квартиры в среднем возрастает на 1%.

А при изменении города Люберцы на Подольск при неизменной общей площади квартиры величина стоимости квартиры уменьшится в среднем на 0,2%.

То есть наибольшее воздействие на цену квартиры оказывает величина жилой площади (X4), а наименьшее - X1 (город области).

-коэффициент показывает на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение.

= 2,29* (17,755/51,492) = 0,79.

= (-32,74) * (0,5/51,492) = - 0,32.

Данные средних квадратических отклонений взяты из таблиц, полученных с помощью инструменты Описательная статистика.

Таблица 1.11.

Описательная статистика (Y)

Y-цена квартиры, тыс. руб.

Среднее

93,65025

Стандартная ошибка

8,141631

Медиана

79,45

Мода

115

Стандартное отклонение

51,4922

Дисперсия выборки

2651,446

Эксцесс

3,611985

Асимметричность

1,805953

Интервал

225,5

Минимум

39,5

Максимум

265

Сумма

3746,01

Счет

40

 

Таблица 1.12.

Описательная статистика (Х4)

X4(жилая площадь квартиры), кв.м

Среднее

39,6175

Стандартная ошибка

2,807241

Медиана

35,5

Мода

46

Стандартное отклонение

17,75455

Дисперсия выборки

315,224

Эксцесс

-0,044

Асимметричность

0,671167

Интервал

68,7

Минимум

15,3

Максимум

84

Сумма

1584,7

Счет

40

 

Таблица1.13.

Описательная статистика (X1)

X1 (город области)

Среднее 0,575
Стандартная ошибка 0,079158
Медиана 1
Мода 1
Стандартное отклонение 0,500641
Дисперсия выборки 0,250641
Эксцесс -2,0034
Асимметричность -0,31539
Интервал 1
Минимум 0
Максимум 1
Сумма 23
Счет 40

- коэффициент определяет долю влияния фактора в суммарном влиянии всех факторов:

Для расчета коэффициентов парной корреляции вычисляем матрицу парных коэффициентов корреляции в программе Excel с помощью инструмента Корреляция настройки Анализа данных.

Таблица 1.14.

  Х4 - жилая площадь квартиры,кв. м X1 - город области Y-цена квартиры, тыс. руб.
X4 - жилая площадь квартиры, кв. м 1    
X1 - город области -0,10732 1  
Y-цена квартиры, тыс. руб. 0,82639   -0,40333 1

(0,79*0,826) / 0,78 = 0,84.

(-0,32*(-0,403))/0,78 = 0,16.

Из полученных расчетов можно сделать вывод, что результативный признак Y (цена квартиры) имеет большую зависимость от фактора X 4 (общая площадь квартиры) (на 84 %), чем от фактора X 1 (город области) (16 %).

ВАРИАНТ 1


Дата добавления: 2019-07-15; просмотров: 246; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!