Формула для вычисления дисперсии
Теорема. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней:

Групповая, внутри групповая, межгрупповая и общая дисперсии
Допустим, что все значения количественного признака X разбиты на k групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти групповую среднюю (см. § 6) и дисперсию значений признака, принадлежащих группе, относительно групповой средней.
Групповой дисперсией называют дисперсию значений признака, принадлежащих группе, относительно групповой средней
,
где ni - частота значения хi; j - номер группы;
- групповая средняя группы j;
- объем группы j.
Зная дисперсию каждой группы, можно найти их среднюю арифметическую.
Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объемам групп:

где Nj — объем группы j;
- объем всей совокупности.
Зная групповые средние и общую среднюю, можно найти дисперсию групповых средних относительно общей средней.
Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:
,
где
- групповая средняя группы j; Nj—объем группы j;
- общая средняя;
- объем всей совокупности.
Теперь целесообразно ввести специальный термин для дисперсии всей совокупности.
Общей дисперсией называют дисперсию значений признака всей совокупности относительно общей средней:
,
где ni - частота значения хi ;
- общая средняя; п — объем всей совокупности.
Теорема. Если совокупность состоит из нескольких групп, то общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий:

Оценка генеральной дисперсии по исправленной выборочной
Можно показать, что выборчная дисперсия является смещенной оценкой генеральной дисперсии:
.
Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Достаточно для этого умножить Dв на дробь п/(п—1). Сделав это, получим исправленную дисперсию, которую обычно обозначают через s2:

Исправленная дисперсия является несмещенной и состоятельной оценкой генеральной дисперсии.
Для оценки среднего квадратического отклонения генеральной совокупности используют «исправленное» среднее квадратическое отклонение (стандартная ошибка), которое равно квадратному корню из исправленной дисперсии:

Точность оценки, доверительная вероятность (надежность).
Доверительный интервал
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, - точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т. е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной оценкой называют интервал, в который оцениваемая величина попадает с заданной надежностью (доверительной вероятностью) g. Интервальная оценка определяется соотношением
. Положительное число d характеризует точность оценки. Величина d определяется из следующего соотношения:
.
d - точность (или погрешность) оценки, d также называют полушириной доверительного интервала. Очевидно, что величина d зависит от надежности оценки g . Для того, чтобы интервальная оценка имела смысл, величина g должна быть близка к 1.
Заменив неравенство
равносильным ему двойным неравенством
или, имеем

Это соотношение следует понимать так: вероятность того, что интервал
заключает в себе (покрывает) неизвестный параметр q, равна g.
Доверительным называют интервал
, который покрывает неизвестный параметр с заданной надежностью g.
Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера.
Дата добавления: 2018-04-04; просмотров: 432; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!
