Точечные оценки и их свойства. Метод подстановки.
Основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины
по данным выборки. Во многих случаях вид распределения
можно считать известным, и задача сводится к получению приближенных значений неизвестных параметров этого распределения. Пусть
- плотность распределения случайной величины
, содержащая один неизвестный параметр
, а
- выборка наблюдений этой случайной величины. Точечной оценкой
параметра
называется приближенное значение этого параметра, полученное по выборке. Точечная оценка выражается числом .
Очевидно, что оценка
есть значение некоторой функции элементов выборки, т.е.
=
(
).Любую функцию элементов выборки называют статистикой.
Качество оценок характеризуется следующими основными свойствами:
1) Несмещенность. Оценка
называется несмещенной оценкой параметра
, если ее математическое ожидание равно оцениваемому параметру, т.е. М(
)=
.
2) Эффективность. Для оценки параметра
может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки
считают ее дисперсию D(
).
Пусть
- различные несмещенные оценки параметра
. Несмещенная оценка
параметра
, дисперсия которой достигает своего наименьшего значения, называется эффективной.
3) Состоятельность. Оценка
=
(
) называется состоятельной, если
сходится по вероятности к
при
т.е. 
Это означает, что при большом числе наблюдений оценка стремится к истинному значению параметра.
Простейший метод статистического оценивания – метод подстановки или аналогии – состоит в том, в качестве оценки той или иной числовой характерис-
тики ( среднего, дисперсии и др.) генеральной совокупности принимают соответствующую характеристику распределения выборки – выборочную характеристику.
Пусть
- выборка из генеральной совокупности с конечными математическим ожиданием m и дисперсией
. По методу подстановки получим оценку математического ожидания
и 
= m* =
(8)
= D* =
(9)
Оценка
является несмещенной и состоятельной а в случае нормального распределения генеральной совокупности - эффективной. Оценка
является смещенной и состоятельной , а в случае нормального распределения генеральной совокупности – эффективной. Чтобы устранить смещение в формуле (8) величину n нужно заменить на (n-1):
= D*=
(10)
Если объем выборки n > 30, то можно применять формулу (9) в силу состоятельности
. В случае малой выборки n
30, следует применять формулу (10).
Лекция 15.
Интервальное оценивание.
Распредления
, Стьюдента и Фишера.
1) Распределение
. Рассмотрим последовательность случайных величин
, причем ξ
~N(0,1). Распределением
с n степенями свободы называется распределение случайной величины
(n)=
. График плотности распределения
(n) приведен на Рис. 4. Математическое ожидание и дисперсия соответственно равны: 

Рис.4
При больших значениях n >30 распределение
стремится к нормальному распределению. Для решения прикладных задач используются квантили
, таблица которых приведена в Приложении 3.
2) Распределение Стьюдента. Пусть
последовательность нормально распределенных случайных величин,
~N(0,1) и случайная величина ξ~N(0,1). Распределением Стьюдента с n степенями свободы называется распределение случайной величины
График распределения приведен на Рис.5. Математическое ожидание и дисперсия соответственно равны:
M(t(n))=0
D(t(n))=n/(n-2), n>2.
Плотность распределения Стьюдента симметрична относительно оси ординат, следовательно, для квантилей
имеет место соотношение
=-
.
В Приложении 4 приведена таблица квантилей распределения Стьюдента.
При n > 30 распределение Стьюдента также стремится к нормальному распределению.
Рис.5
3)Распределение Фишера. Распределением Фишера с
степенями свободы называется распределение случайной величины
.
Математическое ожидание и дисперсия равны:
M
, 
D
, 
График плотности распределения приведен на Рис 6.
Рис. 6.
Квантили распределения Фишера порядка р и 1-р связаны соотношением
.
Таблицы квантилей приведении в Приложении 5.
При малых выборках (n < 30) точечная оценка может оказаться ненадежной. В этом случае строится интервал оценок, который называется доверительным интервалом.
Доверительный интервал (
) это интервал в который с заданной вероятностью p= 1-
содержит неизвестное значение параметра
, т.е.
Р(
) = 1-
.
Число 1-
называют доверительной вероятностью, а значение
- уровнем значимости. Выбор доверительной вероятности определяется конкретными условиями. Обычно используются значения p= 1-
, равные 0,90; 0,95; 0,99.
Один из методов построения доверительных интервалов состоит в следующем.
Предположим ,что существует статистика z = z(
) такая, что
1) закон распределения z известен и не зависит от
;
2) Функция z(
) непрерывна и строго монотонна по
;
3) пусть p= 1-
- заданная вероятность, а
- квантили распределения статистики z порядков
.Тогда с вероятностью 1-
выполняется неравенство
z(
) <
. (11)
Решая неравенство (11) относительно
, найдем границы
доверительного интервала для
. Если плотность распределения статистики z симметрична относительно оси ординат, то доверительный интервал имеет наименьшую длину, а если распределение несимметрично, то длину близкую к наименьшей.
Лекция 16.
Построим доверительный интервал для математического ожидания нормально распределенной генеральной совокупности .
Пусть наблюдается ξ ~ N(a,σ), параметры а и σ - неизвестны. Рассмотрим статистику
Эта статистика имеет распределение Стьюдента с n-1 степенью свободы и, не зависящее от параметра а. Кроме того статистика z как функция от а непрерывна и строго монотонна. Зададим доверительную вероятность р =1-
. Тогда в соответствии с (11) имеет место неравенство 
(12)
Решая неравенство (11) относительно а и учитывая свойство квантилей распределения Стьюдента получим, что с вероятностью 1-
выполняется условие
, (13)
где
и
-точечные оценки, полученные методом подстановки по формулам соответственно (7) и (9),
-квантиль распределения Стьюдента с n-1 степенью свободы.
Найдем доверительный интервал для параметра
. Рассмотрим статистику
,
она имеет распределение
с (n-1) степенью свободы, не зависит от парамет-
ра
, непрерывна и монотонна по
. Зададим доверительную вероятность
р =1-
, тогда в соответствии с (10) имеет место неравенство
.
Решая это неравенство относительно
, получим доверительный интервал для дисперсии при доверительной вероятности р =1-
, (14)
где
-оценка параметра дисперсии, полученная по формуле (9), а
- по формуле (8).
Если распределение генеральной совокупности не является нормальным, то по выборкам большого объема можно построить доверительные интервалы для неизвестных параметров приближенно, используя при этом предельные теоремы теории вероятностей и вытекающие из них асимптотические распределения и оценки. Рассмотрим пример.
Пусть в n независимых испытаниях событие А наступило m раз .Найти доверительный интервал для вероятности р наступления события А. Эффективной оценкой для р является относительная частота
. По теореме Муавра-Лапласа относительная частота h имеет асимптотически нормальное распределение N(p,
), где q=1-p.
Рассмотрим статистику z =( h-p)/
, которая имеет асимптотическое нормальное N(0,1)независимо от значения р. При больших значениях n имеет место приближенное равенство
P
.
Отсюда получаем , что с вероятностью
выполняется неравенство
. (15)
Заменяя значения p и q в левой и правой частях неравенства (15) их оценками
, получаем , что доверительный интервал для вероятности
p приближенно имеет вид
. (16)
Пример 2. При проверке 100 изделий из большой партии обнаружено 10 бракованных деталей. Найти 95% доверительный интервал для доли бракованных деталей во всей партии.
Оценка доли бракованных деталей в партии по выборке равна
=10/100=0,1.
По таблице Приложения 1 найдем квантиль
= 1,96. По формуле (16) 95%-
доверительный интервал для доли бракованных деталей в партии приближенно имеет вид
0,1- 1,96
< p < 0,1 +
и окончательно 0,041 < p < 0,159.
Приближенный доверительный интервал для параметра
в распределении Пуассона имеет вид
(17)
Пример 3. На каждой из 36 АТС города в период с двух до трех часов было зафиксировано в среднем 2 вызова. Считая, что число вызовов для каждой АТС имеет распределение Пуассона с одним и тем же параметром
, приближенно найти доверительный интервал для
с доверительной вероятностью 0,9.
По условию задачи
= 2,
=
= 1,645 . По формуле (17) получим
2 - 1,645
<
< 2 + 1,645
или
1,61
<
< 2,39
Лекция 17.
Дата добавления: 2018-09-23; просмотров: 775; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
