Точечные оценки и их свойства. Метод подстановки.

⇐ ПредыдущаяСтр 2 из 4Следующая ⇒

Основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины по данным выборки. Во многих случаях вид распределения можно считать известным, и задача сводится к получению приближенных значений неизвестных параметров этого распределения. Пусть - плотность распределения случайной величины , содержащая один неизвестный параметр , а - выборка наблюдений этой случайной величины. Точечной оценкой параметра называется приближенное значение этого параметра, полученное по выборке. Точечная оценка выражается числом .

Очевидно, что оценка есть значение некоторой функции элементов выборки, т.е. = ( ).Любую функцию элементов выборки называют статистикой.

Качество оценок характеризуется следующими основными свойствами:

1) Несмещенность. Оценка называется несмещенной оценкой параметра , если ее математическое ожидание равно оцениваемому параметру, т.е. М( )= .

2) Эффективность. Для оценки параметра может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки считают ее дисперсию D( ).

Пусть - различные несмещенные оценки параметра . Несмещенная оценка параметра , дисперсия которой достигает своего наименьшего значения, называется эффективной.

3) Состоятельность. Оценка = ( ) называется состоятельной, если сходится по вероятности к при т.е.

Это означает, что при большом числе наблюдений оценка стремится к истинному значению параметра.

Простейший метод статистического оценивания – метод подстановки или аналогии – состоит в том, в качестве оценки той или иной числовой характерис-

тики ( среднего, дисперсии и др.) генеральной совокупности принимают соответствующую характеристику распределения выборки – выборочную характеристику.

Пусть - выборка из генеральной совокупности с конечными математическим ожиданием m и дисперсией . По методу подстановки получим оценку математического ожидания и

= m* = (8)

= D* = (9)

Оценка является несмещенной и состоятельной а в случае нормального распределения генеральной совокупности - эффективной. Оценка является смещенной и состоятельной , а в случае нормального распределения генеральной совокупности – эффективной. Чтобы устранить смещение в формуле (8) величину n нужно заменить на (n-1):

= D*= (10)

Если объем выборки n > 30, то можно применять формулу (9) в силу состоятельности . В случае малой выборки n 30, следует применять формулу (10).

Лекция 15.

Интервальное оценивание.

Распредления , Стьюдента и Фишера.

1) Распределение . Рассмотрим последовательность случайных величин , причем ξ ~N(0,1). Распределением с n степенями свободы называется распределение случайной величины (n)= . График плотности распределения (n) приведен на Рис. 4. Математическое ожидание и дисперсия соответственно равны:

Рис.4

При больших значениях n >30 распределение стремится к нормальному распределению. Для решения прикладных задач используются квантили , таблица которых приведена в Приложении 3.

2) Распределение Стьюдента. Пусть последовательность нормально распределенных случайных величин, ~N(0,1) и случайная величина ξ~N(0,1). Распределением Стьюдента с n степенями свободы называется распределение случайной величины

График распределения приведен на Рис.5. Математическое ожидание и дисперсия соответственно равны:

M(t(n))=0

D(t(n))=n/(n-2), n>2.

Плотность распределения Стьюдента симметрична относительно оси ординат, следовательно, для квантилей имеет место соотношение =- .

В Приложении 4 приведена таблица квантилей распределения Стьюдента.

При n > 30 распределение Стьюдента также стремится к нормальному распределению.

Рис.5

3)Распределение Фишера. Распределением Фишера с степенями свободы называется распределение случайной величины

Математическое ожидание и дисперсия равны:

M ,

D ,

График плотности распределения приведен на Рис 6.

Рис. 6.

Квантили распределения Фишера порядка р и 1-р связаны соотношением

Таблицы квантилей приведении в Приложении 5.

При малых выборках (n < 30) точечная оценка может оказаться ненадежной. В этом случае строится интервал оценок, который называется доверительным интервалом.

Доверительный интервал ( ) это интервал в который с заданной вероятностью p= 1- содержит неизвестное значение параметра , т.е.

Р( ) = 1- .

Число 1- называют доверительной вероятностью, а значение - уровнем значимости. Выбор доверительной вероятности определяется конкретными условиями. Обычно используются значения p= 1- , равные 0,90; 0,95; 0,99.

Один из методов построения доверительных интервалов состоит в следующем.

Предположим ,что существует статистика z = z( ) такая, что

1) закон распределения z известен и не зависит от ;

2) Функция z( ) непрерывна и строго монотонна по ;

3) пусть p= 1- - заданная вероятность, а - квантили распределения статистики z порядков .Тогда с вероятностью 1- выполняется неравенство

z( ) < . (11)

Решая неравенство (11) относительно , найдем границы доверительного интервала для . Если плотность распределения статистики z симметрична относительно оси ординат, то доверительный интервал имеет наименьшую длину, а если распределение несимметрично, то длину близкую к наименьшей.

Лекция 16.

Построим доверительный интервал для математического ожидания нормально распределенной генеральной совокупности .

Пусть наблюдается ξ ~ N(a,σ), параметры а и σ - неизвестны. Рассмотрим статистику

Эта статистика имеет распределение Стьюдента с n-1 степенью свободы и, не зависящее от параметра а. Кроме того статистика z как функция от а непрерывна и строго монотонна. Зададим доверительную вероятность р =1- . Тогда в соответствии с (11) имеет место неравенство

(12)

Решая неравенство (11) относительно а и учитывая свойство квантилей распределения Стьюдента получим, что с вероятностью 1- выполняется условие

, (13)

где и -точечные оценки, полученные методом подстановки по формулам соответственно (7) и (9), -квантиль распределения Стьюдента с n-1 степенью свободы.

Найдем доверительный интервал для параметра . Рассмотрим статистику

она имеет распределение с (n-1) степенью свободы, не зависит от парамет-

ра , непрерывна и монотонна по . Зададим доверительную вероятность

р =1- , тогда в соответствии с (10) имеет место неравенство

Решая это неравенство относительно , получим доверительный интервал для дисперсии при доверительной вероятности р =1-

, (14)

где -оценка параметра дисперсии, полученная по формуле (9), а - по формуле (8).

Если распределение генеральной совокупности не является нормальным, то по выборкам большого объема можно построить доверительные интервалы для неизвестных параметров приближенно, используя при этом предельные теоремы теории вероятностей и вытекающие из них асимптотические распределения и оценки. Рассмотрим пример.

Пусть в n независимых испытаниях событие А наступило m раз .Найти доверительный интервал для вероятности р наступления события А. Эффективной оценкой для р является относительная частота . По теореме Муавра-Лапласа относительная частота h имеет асимптотически нормальное распределение N(p, ), где q=1-p.

Рассмотрим статистику z =( h-p)/ , которая имеет асимптотическое нормальное N(0,1)независимо от значения р. При больших значениях n имеет место приближенное равенство

P .

Отсюда получаем , что с вероятностью выполняется неравенство

. (15)

Заменяя значения p и q в левой и правой частях неравенства (15) их оценками

, получаем , что доверительный интервал для вероятности p приближенно имеет вид

. (16)

Пример 2. При проверке 100 изделий из большой партии обнаружено 10 бракованных деталей. Найти 95% доверительный интервал для доли бракованных деталей во всей партии.

Оценка доли бракованных деталей в партии по выборке равна =10/100=0,1.

По таблице Приложения 1 найдем квантиль = 1,96. По формуле (16) 95%-

доверительный интервал для доли бракованных деталей в партии приближенно имеет вид

0,1- 1,96 < p < 0,1 + и окончательно 0,041 < p < 0,159.

Приближенный доверительный интервал для параметра в распределении Пуассона имеет вид

(17)

Пример 3. На каждой из 36 АТС города в период с двух до трех часов было зафиксировано в среднем 2 вызова. Считая, что число вызовов для каждой АТС имеет распределение Пуассона с одним и тем же параметром , приближенно найти доверительный интервал для с доверительной вероятностью 0,9.

По условию задачи = 2, = = 1,645 . По формуле (17) получим

2 - 1,645 < < 2 + 1,645 или

1,61 < < 2,39

Лекция 17.

Дата добавления: 2018-09-23; просмотров: 775; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 123 4 Следующая ⇒

Мы поможем в написании ваших работ!