Точечные оценки и их свойства. Метод подстановки.
Основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины по данным выборки. Во многих случаях вид распределения можно считать известным, и задача сводится к получению приближенных значений неизвестных параметров этого распределения. Пусть - плотность распределения случайной величины , содержащая один неизвестный параметр , а - выборка наблюдений этой случайной величины. Точечной оценкой параметра называется приближенное значение этого параметра, полученное по выборке. Точечная оценка выражается числом .
Очевидно, что оценка есть значение некоторой функции элементов выборки, т.е. = ( ).Любую функцию элементов выборки называют статистикой.
Качество оценок характеризуется следующими основными свойствами:
1) Несмещенность. Оценка называется несмещенной оценкой параметра , если ее математическое ожидание равно оцениваемому параметру, т.е. М( )= .
2) Эффективность. Для оценки параметра может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки считают ее дисперсию D( ).
Пусть - различные несмещенные оценки параметра . Несмещенная оценка параметра , дисперсия которой достигает своего наименьшего значения, называется эффективной.
3) Состоятельность. Оценка = ( ) называется состоятельной, если сходится по вероятности к при т.е.
Это означает, что при большом числе наблюдений оценка стремится к истинному значению параметра.
|
|
Простейший метод статистического оценивания – метод подстановки или аналогии – состоит в том, в качестве оценки той или иной числовой характерис-
тики ( среднего, дисперсии и др.) генеральной совокупности принимают соответствующую характеристику распределения выборки – выборочную характеристику.
Пусть - выборка из генеральной совокупности с конечными математическим ожиданием m и дисперсией . По методу подстановки получим оценку математического ожидания и
= m* = (8)
= D* = (9)
Оценка является несмещенной и состоятельной а в случае нормального распределения генеральной совокупности - эффективной. Оценка является смещенной и состоятельной , а в случае нормального распределения генеральной совокупности – эффективной. Чтобы устранить смещение в формуле (8) величину n нужно заменить на (n-1):
= D*= (10)
Если объем выборки n > 30, то можно применять формулу (9) в силу состоятельности . В случае малой выборки n 30, следует применять формулу (10).
|
|
Лекция 15.
Интервальное оценивание.
Распредления , Стьюдента и Фишера.
1) Распределение . Рассмотрим последовательность случайных величин , причем ξ ~N(0,1). Распределением с n степенями свободы называется распределение случайной величины (n)= . График плотности распределения (n) приведен на Рис. 4. Математическое ожидание и дисперсия соответственно равны:
Рис.4
При больших значениях n >30 распределение стремится к нормальному распределению. Для решения прикладных задач используются квантили , таблица которых приведена в Приложении 3.
2) Распределение Стьюдента. Пусть последовательность нормально распределенных случайных величин, ~N(0,1) и случайная величина ξ~N(0,1). Распределением Стьюдента с n степенями свободы называется распределение случайной величины
График распределения приведен на Рис.5. Математическое ожидание и дисперсия соответственно равны:
M(t(n))=0
D(t(n))=n/(n-2), n>2.
|
|
Плотность распределения Стьюдента симметрична относительно оси ординат, следовательно, для квантилей имеет место соотношение =- .
В Приложении 4 приведена таблица квантилей распределения Стьюдента.
При n > 30 распределение Стьюдента также стремится к нормальному распределению.
Рис.5
3)Распределение Фишера. Распределением Фишера с степенями свободы называется распределение случайной величины
.
Математическое ожидание и дисперсия равны:
M ,
D ,
График плотности распределения приведен на Рис 6.
Рис. 6.
Квантили распределения Фишера порядка р и 1-р связаны соотношением
.
Таблицы квантилей приведении в Приложении 5.
При малых выборках (n < 30) точечная оценка может оказаться ненадежной. В этом случае строится интервал оценок, который называется доверительным интервалом.
Доверительный интервал ( ) это интервал в который с заданной вероятностью p= 1- содержит неизвестное значение параметра , т.е.
|
|
Р( ) = 1- .
Число 1- называют доверительной вероятностью, а значение - уровнем значимости. Выбор доверительной вероятности определяется конкретными условиями. Обычно используются значения p= 1- , равные 0,90; 0,95; 0,99.
Один из методов построения доверительных интервалов состоит в следующем.
Предположим ,что существует статистика z = z( ) такая, что
1) закон распределения z известен и не зависит от ;
2) Функция z( ) непрерывна и строго монотонна по ;
3) пусть p= 1- - заданная вероятность, а - квантили распределения статистики z порядков .Тогда с вероятностью 1- выполняется неравенство
z( ) < . (11)
Решая неравенство (11) относительно , найдем границы доверительного интервала для . Если плотность распределения статистики z симметрична относительно оси ординат, то доверительный интервал имеет наименьшую длину, а если распределение несимметрично, то длину близкую к наименьшей.
Лекция 16.
Построим доверительный интервал для математического ожидания нормально распределенной генеральной совокупности .
Пусть наблюдается ξ ~ N(a,σ), параметры а и σ - неизвестны. Рассмотрим статистику
Эта статистика имеет распределение Стьюдента с n-1 степенью свободы и, не зависящее от параметра а. Кроме того статистика z как функция от а непрерывна и строго монотонна. Зададим доверительную вероятность р =1- . Тогда в соответствии с (11) имеет место неравенство
(12)
Решая неравенство (11) относительно а и учитывая свойство квантилей распределения Стьюдента получим, что с вероятностью 1- выполняется условие
, (13)
где и -точечные оценки, полученные методом подстановки по формулам соответственно (7) и (9), -квантиль распределения Стьюдента с n-1 степенью свободы.
Найдем доверительный интервал для параметра . Рассмотрим статистику
,
она имеет распределение с (n-1) степенью свободы, не зависит от парамет-
ра , непрерывна и монотонна по . Зададим доверительную вероятность
р =1- , тогда в соответствии с (10) имеет место неравенство
.
Решая это неравенство относительно , получим доверительный интервал для дисперсии при доверительной вероятности р =1-
, (14)
где -оценка параметра дисперсии, полученная по формуле (9), а - по формуле (8).
Если распределение генеральной совокупности не является нормальным, то по выборкам большого объема можно построить доверительные интервалы для неизвестных параметров приближенно, используя при этом предельные теоремы теории вероятностей и вытекающие из них асимптотические распределения и оценки. Рассмотрим пример.
Пусть в n независимых испытаниях событие А наступило m раз .Найти доверительный интервал для вероятности р наступления события А. Эффективной оценкой для р является относительная частота . По теореме Муавра-Лапласа относительная частота h имеет асимптотически нормальное распределение N(p, ), где q=1-p.
Рассмотрим статистику z =( h-p)/ , которая имеет асимптотическое нормальное N(0,1)независимо от значения р. При больших значениях n имеет место приближенное равенство
P .
Отсюда получаем , что с вероятностью выполняется неравенство
. (15)
Заменяя значения p и q в левой и правой частях неравенства (15) их оценками
, получаем , что доверительный интервал для вероятности p приближенно имеет вид
. (16)
Пример 2. При проверке 100 изделий из большой партии обнаружено 10 бракованных деталей. Найти 95% доверительный интервал для доли бракованных деталей во всей партии.
Оценка доли бракованных деталей в партии по выборке равна =10/100=0,1.
По таблице Приложения 1 найдем квантиль = 1,96. По формуле (16) 95%-
доверительный интервал для доли бракованных деталей в партии приближенно имеет вид
0,1- 1,96 < p < 0,1 + и окончательно 0,041 < p < 0,159.
Приближенный доверительный интервал для параметра в распределении Пуассона имеет вид
(17)
Пример 3. На каждой из 36 АТС города в период с двух до трех часов было зафиксировано в среднем 2 вызова. Считая, что число вызовов для каждой АТС имеет распределение Пуассона с одним и тем же параметром , приближенно найти доверительный интервал для с доверительной вероятностью 0,9.
По условию задачи = 2, = = 1,645 . По формуле (17) получим
2 - 1,645 < < 2 + 1,645 или
1,61 < < 2,39
Лекция 17.
Дата добавления: 2018-09-23; просмотров: 770; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!