Точечные оценки и их свойства. Метод подстановки.



Основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины  по данным выборки. Во многих случаях вид распределения  можно считать известным, и задача сводится к получению приближенных значений неизвестных параметров этого распределения. Пусть - плотность распределения случайной величины , содержащая один неизвестный параметр , а  - выборка наблюдений этой случайной величины. Точечной оценкой  параметра  называется приближенное значение этого параметра, полученное по выборке. Точечная оценка выражается числом .

Очевидно, что оценка  есть значение некоторой функции элементов выборки, т.е.  = ( ).Любую функцию элементов выборки называют статистикой.

Качество оценок характеризуется следующими основными свойствами:

1) Несмещенность.   Оценка  называется несмещенной оценкой параметра , если ее математическое ожидание равно оцениваемому параметру, т.е. М( )= .

2) Эффективность.    Для оценки параметра  может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки  считают ее дисперсию D( ).

Пусть - различные несмещенные оценки параметра . Несмещенная оценка  параметра , дисперсия которой достигает своего наименьшего значения, называется эффективной.

3) Состоятельность. Оценка  = ( ) называется состоятельной, если  сходится по вероятности к  при т.е.

Это означает, что при большом числе наблюдений оценка стремится к истинному значению параметра.

Простейший метод статистического оценивания – метод подстановки или аналогии – состоит в том, в качестве оценки той или иной числовой характерис-

 тики ( среднего, дисперсии и др.) генеральной совокупности принимают соответствующую характеристику распределения выборки – выборочную характеристику.

Пусть  - выборка из генеральной совокупности с конечными математическим ожиданием  m и дисперсией . По методу подстановки получим оценку математического ожидания  и

                                       = m* =                                                      (8)

 

          = D* =              (9)       

Оценка  является несмещенной и состоятельной а в случае нормального распределения генеральной совокупности - эффективной. Оценка  является смещенной и состоятельной , а в случае нормального распределения генеральной совокупности – эффективной. Чтобы устранить смещение в формуле (8) величину n нужно заменить на (n-1):

 

= D*=   (10)

Если объем выборки n > 30, то можно применять формулу (9) в силу состоятельности . В случае малой выборки n  30, следует применять формулу (10).

Лекция 15.

                                 Интервальное оценивание.

Распредления , Стьюдента и Фишера.

1) Распределение . Рассмотрим последовательность случайных величин  , причем ξ ~N(0,1). Распределением  с n степенями свободы   называется распределение случайной величины   (n)= . График плотности распределения (n) приведен на Рис. 4. Математическое ожидание и дисперсия соответственно равны:

                                     

                                      

                                                       Рис.4

При больших значениях n >30  распределение  стремится к нормальному распределению. Для решения прикладных задач используются квантили , таблица которых приведена в Приложении 3.

2) Распределение Стьюдента. Пусть  последовательность нормально распределенных случайных величин, ~N(0,1) и случайная величина ξ~N(0,1). Распределением Стьюдента с n степенями свободы называется распределение случайной величины

                                       

График распределения приведен на Рис.5. Математическое ожидание и дисперсия соответственно равны:

                                     M(t(n))=0

                                     D(t(n))=n/(n-2), n>2.

Плотность распределения Стьюдента симметрична относительно оси ординат, следовательно, для квантилей  имеет место соотношение =- .

В Приложении 4 приведена таблица квантилей распределения Стьюдента.

При  n > 30 распределение Стьюдента  также стремится к нормальному распределению.

                           

                                                      Рис.5 

3)Распределение Фишера. Распределением Фишера с  степенями свободы называется распределение случайной величины

                              .

Математическое ожидание и дисперсия равны:

                             M

 

                             D ,

График плотности распределения приведен на Рис 6.

 

                               

                                                    Рис. 6.

Квантили распределения Фишера порядка   р и 1-р связаны соотношением

                             .

Таблицы квантилей приведении в Приложении 5.

 

   При малых выборках (n < 30) точечная оценка может оказаться ненадежной. В этом случае строится интервал оценок, который называется доверительным интервалом.

Доверительный интервал ( ) это интервал в который с заданной вероятностью p= 1-  содержит неизвестное значение параметра , т.е.

                                            Р( ) = 1- .

 Число 1-  называют доверительной вероятностью, а значение  - уровнем значимости. Выбор доверительной вероятности определяется конкретными условиями. Обычно используются значения p= 1- , равные 0,90; 0,95; 0,99.

Один из методов построения доверительных интервалов состоит в следующем.

Предположим ,что существует статистика z = z( ) такая, что

1) закон распределения  z известен  и не зависит от ;

2) Функция  z( )  непрерывна и строго монотонна по ;

3) пусть p= 1-  - заданная вероятность, а - квантили распределения статистики z порядков .Тогда с вероятностью 1-  выполняется неравенство

                                   z( ) < .                                         (11)

Решая неравенство (11) относительно , найдем границы  доверительного интервала для . Если плотность распределения статистики z симметрична относительно оси ординат, то доверительный интервал имеет наименьшую длину, а если распределение несимметрично, то длину близкую к наименьшей.

 

Лекция 16.

Построим доверительный интервал для математического ожидания нормально распределенной  генеральной совокупности .                                

Пусть наблюдается ξ ~ N(a,σ), параметры а и  σ - неизвестны. Рассмотрим статистику

                                        

Эта статистика имеет распределение Стьюдента с n-1 степенью свободы и, не зависящее от параметра а. Кроме того статистика  z  как функция от а непрерывна и строго монотонна. Зададим доверительную вероятность р =1- . Тогда  в соответствии с (11) имеет место неравенство

                                                                          (12)

Решая неравенство (11) относительно а и учитывая свойство квантилей распределения Стьюдента получим, что с вероятностью 1-  выполняется условие                  

                    ,                                (13)

где и  -точечные оценки, полученные методом подстановки по формулам соответственно (7) и (9),  -квантиль распределения Стьюдента с n-1 степенью свободы.

Найдем доверительный интервал для параметра . Рассмотрим статистику  

                                                 ,

она имеет распределение с  (n-1) степенью свободы, не зависит от парамет-

ра , непрерывна и монотонна по  . Зададим доверительную вероятность 

 р =1- , тогда в соответствии с (10) имеет место неравенство

                                    .

Решая это неравенство относительно , получим доверительный интервал для дисперсии при доверительной вероятности  р =1-                               

                         ,                                  (14)

где -оценка параметра дисперсии, полученная по формуле (9), а - по формуле (8).

Если распределение генеральной совокупности не является нормальным, то по выборкам большого объема можно построить доверительные интервалы для неизвестных параметров приближенно, используя при этом предельные теоремы теории вероятностей и вытекающие из них асимптотические распределения и оценки. Рассмотрим пример.

Пусть в  n  независимых испытаниях событие А наступило m раз .Найти доверительный интервал для вероятности р наступления события А.             Эффективной оценкой для р является относительная частота . По теореме Муавра-Лапласа относительная частота h имеет асимптотически нормальное распределение N(p, ), где  q=1-p.

Рассмотрим статистику z =( h-p)/ , которая имеет асимптотическое нормальное N(0,1)независимо от значения р. При больших значениях n имеет место приближенное равенство

                                      P  .

Отсюда получаем , что с вероятностью  выполняется неравенство

                         .                                     (15)

Заменяя значения p и q в левой и правой частях неравенства (15) их оценками

, получаем , что доверительный интервал для вероятности p приближенно имеет вид

                  .                                (16)

Пример 2. При проверке 100 изделий из большой партии обнаружено 10 бракованных деталей. Найти 95% доверительный интервал для доли бракованных деталей во всей партии.

Оценка доли бракованных деталей в партии по выборке равна =10/100=0,1.

По таблице Приложения 1 найдем квантиль = 1,96. По формуле (16) 95%-

доверительный интервал для доли бракованных деталей в партии приближенно имеет вид 

 0,1- 1,96  < p < 0,1 +      и окончательно   0,041 < p < 0,159.

Приближенный доверительный интервал для параметра  в распределении Пуассона имеет вид

                                                       (17)

Пример 3. На каждой из 36 АТС города в период с двух до трех часов было зафиксировано в среднем 2 вызова. Считая, что число вызовов для каждой АТС имеет распределение Пуассона с одним и тем же параметром , приближенно найти доверительный интервал для  с доверительной вероятностью 0,9.

По условию задачи  = 2, =  = 1,645 . По формуле (17) получим

             2 - 1,645 <  < 2 + 1,645   или    

                                    1,61 <  < 2,39

 Лекция 17.

                 


Дата добавления: 2018-09-23; просмотров: 770; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!