Выборочные условные средние квадратические отклонения
; ;
; .
Выборочные частные коэффициенты регрессии
; .
Выборочное уравнение регрессии
.
В данном случае
или
.
Общий вывод
Результаты выполненного корреляционного анализа показывают, что признак Z имеет статистически значимую умеренную связь как с двумерным массивом признаков X, Y, так и с каждым из этих признаков в отдельности, что дает основание для перехода ко второму этапу статистического исследования - построению регрессионной модели, т.е. выявлению той конкретной математической зависимости переменной Z от переменных X, Y, которой наилучшим, в определенном смысле этого слова, образом отвечают имеющиеся статистические данные.
II. Регрессионный анализ
Постановка задачи
Требуется по указанным выше статистическим данным n=14 стран произвести регрессионный анализ зависимости уровня смертности от средней продолжительность жизни женщин и уровня рождаемости.
Трехмерная линейная модель регрессии
,
где
x, y, z - соответственно значения предикторов X, Y и критериальной переменной Z;
β0, β1, β2 – неизвестные параметры модели;
ε – остаточная компонента (возмущение), численно характеризующей случайность в изменении значения переменной Y.
Установление оценок параметров исходной модели регрессионного анализа
с помощью метода наименьших квадратов
Статистической мерой остаточной компоненты ε в методе наименьших квадратов служит сумма квадратов отклонений действительных (экспериментальных) значений критериальной переменной от соответствующих теоретических (расчетных) значений. Выбираются такие значения параметров модели, при которых данная сумма квадратов будет наименьшей.
|
|
Вектор - несмещенная МНК-оценка параметров - находится по формуле: .
В рассматриваемом случае матрицы , , имеют вид:
Определение вектора осуществляется следующим образом.
1. Находится произведение матриц , :
2. Вычисляется произведение матриц :
3. Определяется матрица, обратная к матрице :
.
4. Находится вектор МНК-оценок параметров модели:
.
Итак,
.
Следовательно, выборочное уравнение линейной регрессии представимо в виде
.
Анализ качества модели регрессии
Необходимо, установить, соответствует ли эмпирическим данным построенная математическая модель:
,
а также определить, достаточно ли включенных в уравнение объясняющих переменных (предикторов) для описания зависимой (критериальной) переменной.
Проверка значимости уравнения множественной линейной регрессии
(при уровне значимости применяемого статистического критерия α=0,05)
Основная гипотеза: «Уравнение регрессии не значимое»:
|
|
.
Для определения значения статистики критерия Фишера:
► вычисляется вектор
,
► находится сумма квадратов расчетных средних значений признака Z:
.
► вычисляется вектор ошибок наблюдений (остатков):
.
► определяется остаточная сумма квадратов отклонений фактических значений признака Z от соответствующих расчетных средних значений, найденных на основе уравнения регрессии Z на (X, Y) - квадрат длины вектора ошибок наблюдений, обусловленных воздействием случайных факторов:
.
Получаем
.
Граничное (критическое) значение определяется согласно уравнению:
,
принимающему в данном случае следующий вид:
.
Используя статистическую таблицу 4 (Распределение Фишера – Снедекора) находим
.
Условие отвержения основной гипотезы: выполняется, следовательно, при уровне уравнение регрессии значимое, т.е.можно заключить, что с вероятностью, равной 0,95, хотя бы один из коэффициентов β 1, β 2 существенно отличается от нуля.
Дата добавления: 2023-01-08; просмотров: 36; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!