Покажите что, при усилении эффекта мультиколлинеарности, дисперсия оценок параметров линейной регрессии модели бесконечно возрастает.
Для наглядности рассмотрим случай k=2. . Пусть для удобства мы пронормировали вектора : .
Тогда , где .
Тогда и .
Если между переменными и существует некая линейная зависимость, т.е. близко к 1, то, как следует из последнего выражения, дисперсии оценок параметров будут иметь большие значения.
При .
8. Вывести критерий Маллоуза.
Обозначения: индекс p - рассматривается модель с p параметрами, . - матрица данных ранга p, а аппроксимирующая подмодель регрессии в некоторой точке :
. Cp- статистика Мэлоуса. Если положить для некоторой точки , то это математическое ожидание может отличаться от из-за возможного смещения модели с p параметрами (здесь - истинные, неизвестные значения). Поэтому, если мы используем в качестве оценки для предсказания значения , где - (неизвестный) отклик в точке , то среднеквадратичная ошибка предсказания равна
. Нужно отыскать такое подмножество, которое минимизирует (4.8) для заданных будущих значений , в качестве будущих точек будем рассматривать имеющиеся точек наблюдения. Он рассмотрел следующую величину (сумму квадратов)
, здесь - «смещение» сумм квадратов, равное .
Однако воспользоваться этой формулой сразу нельзя, так как нам не известны и . Нам нужна несмещённая оценка суммы квадратов , с помощью которой мы могли бы выбирать модели с малым значением . Мэлоус предложил использовать в качестве оценки для статистику , где - подходящая оценка для ,
|
|
Часто берут , где - полное число регрессоров. Можно доказать, что является приблизительно несмещённой оценкой для .
Вариант3.
Основные этапы статистического исследования зависимостей.
Постановочный (единицы, переменные, цели, затраты)
Информационный (активный эксперимент, пассивный эксперимент)
Корреляционный анализ – позволяет ответить на вопросы, имеется ли вообще какая-либо связь между исследуемыми переменными, какова структура этих связей и как измерить их тесноту?
Определение класса допустимых решений
Анализ мультиколлинеарности факторов и отбор наиболее информативных из них
Вычисление оценок неизвестных параметров, входящих в исследуемое уравнение статистической связи.
Анализ точности полученных уравнений связи
Предположения которые используются в теореме Гаусса –Маркова.
Что означает термин «проверка структурных изменений»?
Пусть имеется две выборки ( - наблюдений) и ( - наблюдений). Нулевая гипотеза против альтернативы
Объединяя вместе две регрессии, получим:
В нульгипотезе система ограничений на параметры будет:
|
|
F- статистика: , где – оценки вектора ошибок наблюдения с ограничением . Важным специальным случаем является ситуация когда одна из выборок мала для того чтобы оценить по ней все параметры, параметр n2 = n – n1 < m. Тогда . В этом случае соответствующая статистика имеет вид: .
Термин “полная модель”.
Полная модель – в которой число регрессоров совпадает с числом исходных регрессоров.
Дата добавления: 2018-08-06; просмотров: 199; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!