Гипотезы бывают простые и сложные.
Лекция № 11. Проверка статистических гипотез
Основные понятия
На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез, истин), от которых зависят правомерность и эффективность применяемых методов анализа, например:
1) можно ли считать подлежащие обработке данные результатами независимых наблюдений случайной величины;
2) при наличии нескольких групп исходных данных можно ли считать, что они извлечены из одной генеральной совокупности;
3) симметричен ли закон распределения исследуемой случайной величины относительно центра группирования;
4) какую модель надо выбрать для описания эмпирических данных;
5) какова природа и величина неизвестных параметров рассматриваемой стохастической схемы и т. д.
Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.
Результат такого сопоставления может быть как отрицательным (данные наблюдения противоречат выдвинутой гипотезе, следовательно, от нее надо отказаться), так и положительным (наблюдения не противоречат высказанной гипотезе, и поэтому ее можно принять в качестве одного из решений).
Неотрицательный результат статистической проверки гипотез не означает, что высказанное нами предположительное утверждение является наилучшим. Могут также существовать другие гипотезы, которые не будут противоречить тем же эмпирическим данным.
|
|
Принятая в этом случае гипотеза будет рассматриваться как достаточно правдоподобное, не противоречащее опыту утверждение.
При анализе статистических данных решаются следующие задачи, связанные с проверками гипотез:
1. Проверка гипотез о равенстве числовых характеристик случайной величины (гипотезы о равенстве математических ожиданий и дисперсий);
2. Проверка гипотез об однородности двух или нескольких выборок (гипотезы об однородности проверяются выборок по критерию и по критерию Вилкоксона);
3. Проверка гипотез о согласии эмпирического распределения и выбранной модели (критерий согласия Пирсона и Колмогорова);
4. Проверка гипотез о стохастической независимости элементов выборки (критерий стохастической независимости Аббе, «восходящих» и «нисходящих» серий и серий, основанных на медиане).
Остановимся более подробно на проверке гипотез о законах и параметрах распределений.
При изучении случайных величин необходимо знать законы и параметры распределений.
|
|
Если закон распределения неизвестен, но есть основания предполагать, что он имеет определенный вид (назовем его А), то выдвигают гипотезу: случайная величина X распределена по закону А.
Встречаются задачи, в которых закон распределения случайной величины X известен, а неизвестен его параметр . В этом случае выдвигают гипотезу:
Например, случайная величина X имеет распределение Пуассона (гипотеза о законе распределения); случайная величина с нормальным законом распределения имеет математическое ожидание (гипотеза о параметре распределения).
Наряду с выдвинутой гипотезой рассматривается и противоречащая ей гипотеза.
Нулевой (основной) называют выдвинутую гипотезу .
Конкурирующей называют, гипотезу , которая противоречит нулевой гипотезе.
Например, если проверяется гипотеза о равенстве параметра некоторому значению ,т.е. , то в качестве конкурирующей гипотезы можно рассматривать одну из следующих гипотез:
Выбор конкурирующей гипотезы определяется конкретной формулировкой задачи.
Гипотезы бывают простые и сложные.
Гипотезу называют простой, если она содержит только одно предположение. Например, параметр показательного распределения равен 6, т.е.
|
|
Гипотезу называют сложной, если она состоит из конечного или бесконечного числа простых гипотез. Например,
Нулевая гипотеза может быть правильной или неправильной, поэтому её необходимо проверить. Проверка гипотез осуществляется статистическими методами.
Из-за случайности выборки в результате проверки могут возникнуть ошибки и быть приняты неправильные решения. Возможны ошибки первого и второго рода.
Ошибка первого рода состоит втом, что отвергается правильная гипотеза , а принимается неправильная гипотеза .
Ошибка второго рода стоит в том, что правильная гипотеза отвергается, а принимается неправильная гипотеза .
Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эту величину обозначают различными буквами в зависимости от закона её распределения. Поскольку нас не интересует вид распределения этой величины, обозначим её через K.
Случайную величину K, которая служит для проверки нулевой гипотезы, называют статическим критерием (статистикой). Мощность критериев равна .
Например, если проверяют гипотезу о равенстве дисперсий нормальных совокупностей ( ), то в качестве критерия принимают отношение выборочных исправленных дисперсий .
|
|
Для проверки нулевой гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и получают частное значение критерия, называемое наблюдаемым значением .
Например, если по выборкам, извлечённым из двух нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии то наблюдаемое значение критерия
После выбора критерия K множество всех его возможных значений разбивают на два непересекающихся подмножества, называемые критической областью и областью принятия гипотезы.
Дата добавления: 2022-01-22; просмотров: 24; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!