Статистические оценки параметров распределения.
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, удалось установить закон распределения этого признака. Возникает задача оценки параметров, которыми определяется это распределение. Например, изучаемый признак распределен в генеральной совокупности нормально. Тогда требуется оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.
Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака x1, x2 … xn, полученные в результате n наблюдений. Через эти данные и выражают оцениваемый параметр. Найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближенное значение оцениваемого параметра.
Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Точечной называют оценку, которая определяется одним числом. Интервальной называют оценку, которая задается двумя числами – концами интервалов.
Для оценки неизвестных параметров теоретического распределения применяются характеристики статистического распределения выборки – выборочная средняя, выборочная дисперсия, выборочное среднее квадратическое отклонение. Это точечные оценки, вычисляемые по случайной выборке.
Выборочные характеристики как величины случайные, варьирующие вокруг своих генеральных параметров, в основном не совпадают с ними. Для того, чтобы оценки давали «хорошее» приближение оцениваемых параметров, они должны удовлетворять определённым требованиям: быть несмещёнными, эффективными и состоятельными.
Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ*) = Θ.
Смещенной, если M(Θ*) ≠ Θ.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
Состоятельной называют статистическую оценку, которая при n→∞ стремится по вероятности к оцениваемому параметру.
Оценка генеральной средней.
Теорема: Выборочная средняя
повторной выборки есть несмещённая и состоятельная оценка генеральной средней
, причем
- дисперсия выборочной средней.
Выборочная средняя
повторной выборки для нормально распределенной генеральной совокупности является эффективной оценкой генеральной средней
Определение:Среднее квадратическое отклонение выборочной средней
называется стандартной ошибкой выборки
- стандартная ошибка выборки
Величину средней и её стандартную ошибку записывают так: 
Ошибка средней арифметической может быть выражена в относительных величинах, т.е. в %. В этом случае её называют показателем точности
и вычисляют по формуле:
|
Относительная ошибка выборки показывает, на сколько процентов выборочная оценка отклоняется от параметра генеральной совокупности.
Чем меньше величина
, тем достовернее, надёжнее полученная средняя. Точность средней арифметической является приемлемой, если этот коэффициент не превышает 5%.
При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам.
По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ.
Если δ > 0 и │Θ – Θ*│< δ, то чем меньше δ, тем оценка точнее.
Т.о., положительное число δ характеризует точность оценки.
Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству │Θ – Θ*│< δ; можно лишь говорить о вероятности
, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность
, с которой осуществляется неравенство │Θ – Θ*│< δ
= 0,95; 0,99; 0,999.

Заменив неравенство │Θ – Θ*│< δ равносильным ему двойным неравенством



Вероятность того, что интервал (Θ* - δ; Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна
.
Доверительным интервалом называется случайный интервал
(Θ*- δ; Θ*+ δ), в пределах которого с вероятностью
находится неизвестный оцениваемый параметр.
Число
называется доверительной вероятностью, уровнем доверия или надежностью оценки. Это значение задают заранее. Тогда, зная закон распределения случайной величины, можно найти доверительный интервал.
Число p(или
) называется уровнем значимости и показывает, с какой вероятностью заключение о надежности оценки ошибочно.
Его находят по формуле
.
Величина
может иметь три значения: 0,95; 0,99; 0,999.
Соответственно p: 0,05; 0,01; 0,001.
Очевидно, что чем меньше p, тем точнее оценка.
На рис.16 показан геометрический смысл доверительной вероятности, уровня значимости и доверительного интервала. Длина доверительного интервала определяется
% (значение доверительной вероятности, выраженной в процентах) площади под нормальной кривой выборочного распределения некоторой случайной величины. Уровень значимости
соответствует той оставшейся части (в %) площади под нормально кривой, которая выходит за границы доверительного интервала.

Рис.16 Доверительный интервал, уровень значимости
, доверительная вероятность
для кривой нормального распределения.
Например, доверительная вероятность
означает, что длина искомого доверительного интервала ограничивается 95% площади под кривой нормального распределения, т.е. полученная интервальная оценка справедлива для 95% членов генеральной совокупности. Оставшиеся 5% могут иметь отклонения от значений полученной оценки. С увеличением доверительной вероятности (уменьшением уровня значимости) увеличивается длина доверительного интервала.
Определение: наибольшее отклонение
оценки
от оцениваемого параметра
в частности, выборочной средней ( или доли ) от генеральной средней ( или доли ), которое возможно с заданной доверительной вероятностью
, называется предельной ошибкой выборки
Ошибка
является ошибкой репрезентативности (представительности) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть её (выборка), отобранная случайно.
Прежде, чем перейти к интервальным оценкам параметров распределения, рассмотрим некоторые важные распределения случайной величины.
Дата добавления: 2019-07-15; просмотров: 726; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
