Отсев грубых погрешностей наблюдений



Проверка статистических гипотез

 

Проверка статистических гипотез является одной из основных задач математической статистики. Суть этой задачи состоит в том, что на основании выборочных данных должно быть принять (или отвергнуто) некоторое предположение (статистическая гипотеза) относительно генеральной совокупности.

Процедура сопоставления гипотезы с выборочными данными называется проверкой гипотез.

Задача статистической проверки ставится в следующем виде: относительно некоторой генеральной совокупности высказывается та или иная гипотеза Н. Из генеральной совокупности извлекается выборка. Требуется указать правило, при помощи которого можно было бы по выборке решить вопрос, следует ли принять гипотезу Н, либо отклонить ее. Например, эффективнее ли лекарство, испытанное на определенном числе людей, по сравнению с другими способами лечения? Аналогичен вопрос о новых правилах приема в вуз, методах обучения, преимуществах новой разрабатываемой техники т.п.

Выдвигаемая гипотеза может быть правильной или неправильной, поэтому возникает задача ее проверки.

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке.

Статистические гипотезы делятся на параметрические (гипотезы о параметрах распределения) и непараметрические (о виде неизвестного распределения)

Одну из гипотез выдвигают в качестве основной НО, а другую, являющуюся логическим отрицанием НО, т.е. противоположную НО, - в качестве конкурирующей (альтернативной) и обозначают Н1.

Имея две гипотезы НО и Н1 надо на основе выборки Х1, Х2, … Xn принять либо основную гипотезу НО, либо конкурирующую Н1.

Правило, по которому принимается решение принять или отклонить гипотезу, называют статистическим критерием проверки гипотезы.

Для проверки гипотезы на основании выборки формируют функцию выборки ), которая называется статистикой критерия.

Основной принцип проверки гипотез состоит в следующем. Множество возможных значений статистики критерия Tn разбивается на два непересекающихся подмножества: критическую область S, т.е. область отклонения гипотезы Н0 и область  принятия этой гипотезы. Если фактически полученное по выборке значение статистики критерия попадает в критическую область, то основная гипотеза Н0 отклоняется, и принимается альтернативная гипотеза Н1. Если значение критерия попадает в , то принимается Н0, Н1 отклоняется.

При проверке гипотезы могут быть допущены ошибки двух типов:

Ошибка первого рода состоит в том, что отвергается нулевая гипотеза, когда на самом деле она верна.

Ошибка второго рода состоит в том, что отвергается альтернативная гипотеза Н1, когда на самом деле она верна.

Вероятность ошибки первого рода (обозначается α) называется уровнем значимости критерия:

Чем меньше α, тем меньше вероятность отклонить верную гипотезу. Допустимую ошибку первого рода обычно задают заранее. Обычно для α используют стандартные значения α=0,05; 0,01; 0,005; 0,001.

Вероятность ошибки второго рода (обозначается β):

Величину 1-β, т.е. вероятность недопущения ошибки второго рода (отвергнуть неверную гипотезу Н0, принять верную Н1), называют мощностью критерия.

Чем больше мощность критерия, тем меньше вероятность ошибки второго рода.

Последствия ошибок 1-го, 2-ого рода совершенно различны:

-применительно к радиолокации говорят, что α – вероятность пропуска сигнала, β – вероятность ложной тревоги;

-применительно к производству – α – риск поставщика (т.е. забраковка по выборке всей партии изделий, удовлетворяющих стандарту), β – риск потребителя (т.е. прием по выборке всей партии изделий, не удовлетворяющих стандарту);

-применительно к судебной практике, ошибка 1-ого рода приводит к оправданию виновного, ошибка 2-ого рода - осуждению невиновного.

Отметим, что одновременное уменьшение ошибок 1-ого и 2-ого рода возможно лишь при увеличении объема выборок. Поэтому обычно при заданном уровне значимости отыскивается критерий с наибольшей мощностью.

 

Отсев грубых погрешностей наблюдений

 

В случае отсева грубых погрешностей (ошибок) нулевая гипотеза формулируется следующим образом:

НО: «Среди результатов наблюдений (выборочных, опытных данных) нет резко выделяющихся (аномальных) значений»

Альтернативной гипотезой может быть

Либо Н1: «среди результатов наблюдений есть только одна грубая ошибка»,

Либо Н1: «среди результатов наблюдений есть две или более грубых ошибок».

Критерий Н.В.Смирнова

Если известно, что есть только одно аномальное значение, то оно будет крайним членом вариационного ряда (т.е. ряда наблюдений, расположенных в возрастающей последовательности: ). Поэтому проверять выборку на наличие одной грубой ошибки естественно при помощи статистики

                      (5.10.1)

Если сомнения вызывает первый член вариационного ряда , или

                      (5.10.2.)

Если сомнителен максимальный член вариационного ряда .

Н.В.Смирновым исследовалось распределение указанных статистик (5.10.1) и (5.10.2) и были составлены таблицы точек (квантили порядка  для α=0,1; 0,05; 0,01 при объеме выборки от 3 до 20 опытов.

При выбранном уровне значимости α критическая область для критерия Н.В.Смирнова строится следующим образом:

- это табличное значение. В случае, когда выполняется условие (статистика попадает в критическую область), то нулевая гипотеза отклоняется, т.е. выброс  или не характерен для данной выборки, после чего значения  или  исключают из рассмотрения, а найденные ранее оценки подвергаются корректировке с учетом отброшенного результата.

 


Дата добавления: 2020-12-22; просмотров: 94; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!