Используя пошаговую множественную регрессию (метод исключения), построим модель формирования цены квартиры за счёт значимых факторов.
Для построения множественной регрессии воспользуемся функцией Регрессия программы Excel, включив в нее все факторы. В результате получаем результативные таблицы, из которых нам необходим t-критерий Стьюдента.
Таблица 1.8.а.
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |
Y-пересечение | 30,45 | 10,14617717 | 3,001135 | 0,004862638 |
X4 (жилая площадь квартиры) | 3,849 | 0,499544248 | 7,704503 | 3,99877E-09 |
X2 (число комнат в квартире) | -28,532 | 8,441863622 | -3,379775 | 0,00175709 |
X1 (город области) | -36,176 | 7,070149312 | -5,116777 | 1,05101E-05 |
Таблица 1.8.б.
Регрессионная статистика | |
Множественный R | 0,913962927 |
R-квадрат | 0,835328231 |
Нормированный R-квадрат | 0,821605584 |
Стандартная ошибка | 21,74863765 |
Наблюдения | 40 |
Таблица 1.8.в.
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 3 | 86378,29447 | 28792,76482 | 60,87223598 | 3,55864E-14 |
Остаток | 36 | 17028,11663 | 473,0032397 | ||
Итого | 39 | 103406,4111 |
Получаем модель вида:
.
Поскольку < (4,10 < 60,87), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-3,38│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-4=36: =1,688.
Поскольку │-3,38│> 1,688 модель следует признать адекватной.
Коэффициент парной корреляции независимых переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) = 0,92. Так как это больше 0,8, следовательно в исходных данных имеется мультиколлинеарность. Чтобы избавиться от мультиколлинеарности из переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) оставим в модели X4, так как он в большей степени связан с зависимой переменной Y(цена квартиры).
|
|
Вычисляем новую математическую модель.
Таблица 1.9.а.
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |
Y-пересечение | 21,44848618 | 11,0838945 | 1,935103784 | 0,060649342 |
X4 (жилая площадь квартиры) | 2,297644203 | 7,921039863 | 10,28689171 | 0,000196621 |
X1(город области) | -32,73940067 | 0,223356507 | -4,133220036 | 2,11022E-12 |
Таблица 1.9.б.
Регрессионная статистика | |
Множественный R | 0,884916669 |
R-квадрат | 0,783077511 |
Нормированный R-квадрат | 0,771351971 |
Стандартная ошибка | 24,62210392 |
Наблюдения | 40 |
Таблица 1.9.в.
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 2 | 80975,23504 | 40487,61752 | 66,78391916 | 5,26787E-13 |
Остаток | 37 | 22431,17605 | 606,2480015 | ||
Итого | 39 | 103406,4111 |
Получаем модель вида: .
Поскольку < (4,10 < 66,78), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-4,13│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-3=37: = 1,687.
|
|
Поскольку │-4,13│> 1,687 модель следует признать адекватной.
Мультиколлинеарность отсутствует.
Оцените качество построенной модели.
а) Для модели коэффициент детерминации составил 0,78, для модели он составил 0,683, поскольку чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели, то первая модель является лучшей по данному критерию.
б) Рассчитаем среднюю ошибку аппроксимации:
Для предыдущей модели она составила 30,57.
в) Рассчитаем табличное значение F-критерия Фишера при вероятности 0,05:
=3,25
= 66,78
= 66,78 > =3,25 модель по данному критерию адекватна.
Для оценки значимого фактора полученной математической модели, рассчитаем коэффициенты эластичности, и - коэффициенты.
Коэффициент эластичности показывает, насколько процентов изменится результативный признак при изменении факторного признака на 1%:
.
Э X4 = 2,29 *(39,62/93,65) = 1%.
Э X1 = (-32,74) * (0,58/93,65) = - 0,2 %.
То есть с ростом общей площади квартиры на 1% стоимость квартиры в среднем возрастает на 1%.
|
|
А при изменении города Люберцы на Подольск при неизменной общей площади квартиры величина стоимости квартиры уменьшится в среднем на 0,2%.
То есть наибольшее воздействие на цену квартиры оказывает величина жилой площади (X4), а наименьшее - X1 (город области).
-коэффициент показывает на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение.
= 2,29* (17,755/51,492) = 0,79.
= (-32,74) * (0,5/51,492) = - 0,32.
Данные средних квадратических отклонений взяты из таблиц, полученных с помощью инструменты Описательная статистика.
Таблица 1.11.
Описательная статистика (Y)
Y-цена квартиры, тыс. руб. | |
Среднее | 93,65025 |
Стандартная ошибка | 8,141631 |
Медиана | 79,45 |
Мода | 115 |
Стандартное отклонение | 51,4922 |
Дисперсия выборки | 2651,446 |
Эксцесс | 3,611985 |
Асимметричность | 1,805953 |
Интервал | 225,5 |
Минимум | 39,5 |
Максимум | 265 |
Сумма | 3746,01 |
Счет | 40 |
Таблица 1.12.
Описательная статистика (Х4)
X4(жилая площадь квартиры), кв.м | |||
Среднее | 39,6175 | ||
Стандартная ошибка | 2,807241 | ||
Медиана | 35,5 | ||
Мода | 46 | ||
Стандартное отклонение | 17,75455 | ||
Дисперсия выборки
| 315,224 | ||
Эксцесс | -0,044 | ||
Асимметричность | 0,671167 | ||
Интервал | 68,7 | ||
Минимум | 15,3 | ||
Максимум | 84 | ||
Сумма | 1584,7 | ||
Счет | 40 |
Таблица1.13.
Описательная статистика (X1)
X1 (город области) | |
Среднее | 0,575 |
Стандартная ошибка | 0,079158 |
Медиана | 1 |
Мода | 1 |
Стандартное отклонение | 0,500641 |
Дисперсия выборки | 0,250641 |
Эксцесс | -2,0034 |
Асимметричность | -0,31539 |
Интервал | 1 |
Минимум | 0 |
Максимум | 1 |
Сумма | 23 |
Счет | 40 |
- коэффициент определяет долю влияния фактора в суммарном влиянии всех факторов:
Для расчета коэффициентов парной корреляции вычисляем матрицу парных коэффициентов корреляции в программе Excel с помощью инструмента Корреляция настройки Анализа данных.
Таблица 1.14.
Х4 - жилая площадь квартиры,кв. м | X1 - город области | Y-цена квартиры, тыс. руб. | |
X4 - жилая площадь квартиры, кв. м | 1 | ||
X1 - город области | -0,10732 | 1 | |
Y-цена квартиры, тыс. руб. | 0,82639 | -0,40333 | 1 |
(0,79*0,826) / 0,78 = 0,84.
(-0,32*(-0,403))/0,78 = 0,16.
Из полученных расчетов можно сделать вывод, что результативный признак Y (цена квартиры) имеет большую зависимость от фактора X 4 (общая площадь квартиры) (на 84 %), чем от фактора X 1 (город области) (16 %).
ВАРИАНТ 1
Дата добавления: 2019-07-15; просмотров: 246; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!