Построим поле корреляции результативного признака (стоимости квартиры) и наиболее тесно связанного с ним фактора (жилой площади квартиры).
Для этого воспользуемся инструментом построения точечной диаграммы программы Excel.
В результате получаем поле корреляции цены квартиры, тыс. долл. и жилой площади квартиры, кв.м. (рисунок 1.1.).
Рисунок 1.1.
Рассчитаем параметры линейной парной регрессии для каждого фактора Х.
Для расчета параметров линейной парной регрессии воспользуемся инструментом Регрессия, входящим в настойку Анализ данных.
В диалоговом окне Регрессияв поле Входной интервал Y вводим адрес диапазона ячеек, которые представляет зависимую переменную, т.е. стоимость квартир. В поле Входной интервал Х вводим адрес диапазона, который содержит значения независимых переменных (город области, жилая площадь квартиры, число комнат в квартире). Выполним поочередно вычисления параметры парной регрессии для каждого фактора Х.
Для Х4 получили следующие данные, представленные в таблице 1.2:
Таблица 1.2
Коэффициенты | |
Y-пересечение | -1,30173 |
X4 - жилая площадь квартиры, кв.м | 2,396718 |
Уравнение регрессии зависимости цены квартиры от жилой площади квартиры имеет вид:
Для Х2 получили следующие данные, представленные в таблице 1.3:
Таблица 1.3
Коэффициенты | |
Y-пересечение | 13,21194 |
X2-число комнат в квартире | 33,51596 |
Уравнение регрессии зависимости цены квартиры от числа комнат в квартире имеет вид:
Для Х1 получили следующие данные, представленные в таблице 1.4:
Таблица 1.4
|
|
Коэффициенты | |
Y-пересечение | 117,5035 |
X1 – город области | -41,484 |
Уравнение регрессии зависимости цены квартиры от города области имеет вид:
Оценим качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Установим, какая модель является лучшей.
Коэффициент детерминации, среднюю ошибку аппроксимации мы получили в результате расчетов, проведенных в пункте 3. Полученные данные представлены в следующих таблицах:
Данные по Х4:
Таблица 1.5а
Регрессионная статистика | |
Множественный R | 0,82639 |
R-квадрат | 0,682921 |
Нормированный R-квадрат | 0,674577 |
Стандартная ошибка | 29,37418 |
Наблюдения | 40 |
Таблица 1.5б
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1 | 70618,39 | 70618,39 | 81,84389 | 5,12E-11 |
Остаток | 38 | 32788,02 | 862,8426 | ||
Итого | 39 | 103406,4 |
Данные по Х2:
Таблица 1.6а
Регрессионная статистика | |
Множественный R | 0,68821 |
R-квадрат | 0,473634 |
Нормированный R-квадрат | 0,459782 |
Стандартная ошибка | 37,84653 |
Наблюдения | 40 |
Таблица 1.6б
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1 | 48976,74 | 48976,74 | 34,19305 | 9,22E-07 |
Остаток | 38 | 54429,67 | 1432,36 | ||
Итого | 39 | 103406,4 |
Данные по Х1:
|
|
Таблица 1.7а
Регрессионная статистика | |
Множественный R | 0,403334 |
R-квадрат | 0,162678 |
Нормированный R-квадрат | 0,140644 |
Стандартная ошибка | 47,73403 |
Наблюдения | 40 |
Таблица 1.7б
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1 | 16821,99 | 16821,99 | 7,3828 | 0,009861 |
Остаток | 38 | 86584,43 | 2278,538 | ||
Итого | 39 | 103406,4 |
А) Коэффициент детерминации определяет, какая доля вариации признака У учтена в модели и обусловлена влиянием на него фактора Х. Чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели.
В программе Excel обозначается R-квадрат.
= 0,683
= 0,474
= 0,163
Исходя из данного критерия наиболее адекватной является модель уравнения регрессии зависимости цены квартиры от жилой площади квартиры (Х4).
Б) Среднюю ошибку аппроксимации рассчитаем по формуле:
, где числитель – сумма квадратов отклонения расчетных значений от фактических. В таблицах она находится в столбце SS, строке Остатки.
Среднее значение цены квартиры рассчитаем в Excel с помощью функции СРЗНАЧ. = 93,65025 тыс. долл.
|
|
При проведении экономических расчетов модель считается достаточно точной, если средняя ошибка аппроксимации меньше 5%, модель считается приемлемой, если средняя ошибка аппроксимации меньше 15%.
По данному критерию, наиболее адекватной является математическая модель для уравнения регрессии зависимости цены квартиры от жилой площади квартиры (Х4).
В) Для проверки значимости модели регрессии используется F-тест. Для этого выполняется сравнение и критического (табличного) значений F-критерия Фишера.
Расчетные значения приведены в таблицах 1.5б, 1.6б, 1.7б (обозначены буквой F).
Табличное значение F-критерий Фишера рассчитаем в Excel с помощью функции FРАСПОБР. Вероятность возьмем равной 0,05. Получили:
= 4,10
Расчетные значения F-критерий Фишера для каждого фактора сравним с табличным значением:
= 81,84 > = 4,10 модель по данному критерию адекватна.
= 34,19 > = 4,10 модель по данному критерию адекватна.
= 7,38 > = 4,10 модель по данному критерию адекватна.
Проанализировав данные по всем трем критериям, можно сделать вывод, что наиболее лучшей является математическая модель, построена для фактора жилая площадь квартиры, которая описана линейным уравнением .
5. Для выбранной модели зависимости цены квартиры от жилой площади квартиры осуществим прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора составит 80% от его максимального значения. Представим графически: фактические и модельные значения, точки прогноза.
|
|
Рассчитаем прогнозное значение Х, по условию оно составит 80% от максимального значения.
Рассчитаем Хmax в Excel с помощью функции МАКС.
= 84кв.м
=0,8 *84 = 67,2 кв.м
Для получения прогнозных оценок зависимой переменной подставим полученное значение независимой переменной в линейное уравнение:
= -1,3+2,4*67,2 = 159,98 тыс.долл.
Определим доверительный интервал прогноза, который будет иметь следующие границы:
Для вычисления доверительного интервала для прогнозного значения рассчитываем величину отклонения от линии регрессии. Для модели парной регрессии величина отклонения рассчитывается:
, т.е. значение стандартной ошибки из таблицы 1.5а.
(Так как число степеней свободы равно единицы, то знаменатель будет равен n-2).
= 29,37
Для расчета коэффициента воспользуемся функцией Excel СТЬЮДРАСПОБР, вероятность возьмем равную 0,1, число степеней свободы 38.
= 1,686
Значение рассчитаем с помощью Excel, получим 12294.
Определим верхнюю и нижнюю границы интервала.
159,98+51,63= 211,61
159,98-51,63= 108,35
Таким образом, прогнозное значение = 159,98 тыс.долл., будет находиться между нижней границей, равной 108,35 тыс.долл. и верхней границей, равной 211,61 тыс.долл.
Фактические и модельные значения, точки прогноза представлены графически на рисунке 1.2.
Рисунок 1.2.
Дата добавления: 2019-07-15; просмотров: 486; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!