Значения критерия Романовского
Критерии исключения грубых погрешностей
При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистические критерии, предварительно определив, какому виду распределения соответствует результат измерений.
Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.
Критерий "трех сигм"применяется для результатов измерений, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q < 0,003, маловероятен и его можно считать промахом, если |х? -хi| > 3Sx , где Sx — оценка СКО измерений. Величины х и Sx вычисляют без учета экстремальных значений xi. Данный критерий надежен при числе измерений n > 20... 50.
Это правило обычно считается слишком жестким, поэтому рекомендуется назначать границу цензурирования в зависимости от объема выборки: при
6 < n < 100 она равна 4Sx; при 100 < n < 1000 - 4,5Sx; при 1000 < n < 10000 - 5Sx. Данное правило также применимо только для нормального закона.
В общем случае границы цензурирования trpSx выборки зависят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, принадлежащих обрабатываемой выборке. Приводится выражение для приближенного расчета коэффициента trp при уровне значимости q < l/(n + 1):
|
|
(4)
где e — эксцесс распределения. Данные выражения применимы для:
• кругловершинных двухмодальных распределений с e = 1,5,..., 3, являющихся композицией дискретного двузначного и нормального распределений;
• островершинных двухмодальных распределений с e = 1,5,..., 6, являющихся композицией дискретного двузначного распределения и распределения Лапласа;
• композиций равномерного и экспоненциальных распределений с показателем степени a = 1/2 при e = 1,8,...,6;
• экспоненциальных распределений с e = 1,5,...,6.
Критерий Романовскогоприменяется, если число измерений n < 20. При этом вычисляется отношение |(х? - xi)/SX| = b и сравнивается с критерием bт, выбранным по табл. 1. Если b ³ bт, то результат хi считается промахом и отбрасывается.
Пример 1. При диагностировании топливной системы автомобиля результаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по критерию Романовского, не является ли он промахом.
|
|
Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерений. Они соответственно равны 25 и 2,6 л на 100 км.
Поскольку n < 20, то по критерию Романовского при уровне значимости 0,01 и n = 4 табличный коэффициент bт = 1,73. Вычисленное для последнего, пятого измерения b = |(25 – 30)|/2,6 = 1,92 > 1,73 .
Критерий Романовского свидетельствует о необходимости отбрасывания последнего результата измерения.
Критерий Шарльеиспользуется, если число наблюдений в ряду велико (n> 20). Тогда по теореме Бернулли число результатов, превышающих по абсолютному значению среднее арифметическое значение на величину КШSx, будет n[l - Ф(КШ)], где Ф(КШ) — значение нормированной функции Лапласа для X = КШ. Если сомнительным в ряду результатов наблюдений является один результат, то n[1-Ф(Кш)] = 1. Отсюда Ф(КШ) = (n -1)/n.
Значения критерия Шарлье приведены в табл. 2.
Таблица 1
Значения критерия Романовского
q | n =4 | n = 6 | n = 8 | n = 10 | n = 12 | n = 15 | n = 20 |
0,01 | 1,73 | 2,16 | 2,43 | 2,62 | 22,75 | 2,90 | 3,08 |
0,02 | 1,72 | 2,13 | 2,37 | 2,54 | 2,66 | 2,80 | 2,96 |
0,05 | 1,71 | 2,10 | 2,27 | 2,41 | 2,52 | 2,64 | 2,78 |
0,10 | 1,69 | 2,00 | 2,17 | 2,29 | 2,39 | 2,49 | 2,62 |
Таблица 2
Значения критерия Шарльe
п | 5 | 10 | 20 | 30 | 40 | 50 | 100 |
Кщ | 1,3 | 1,65 | 1.96 | 2,13 | 2,24 | 2,32 | 2,58 |
|
|
Таблица 3
Значения критерия Диксона
n |
Zq при q, равном |
|||
0,10 | 0,05 | 0,02 | 0,01 | |
4 | 0,68 | 0,76 | 0,85 | 0,89 |
6 | 0,48 | 0,56 | 0,64 | 0,70 |
8 | 0,40 | 0,47 | 0,54 | 0,59 |
10 | 0,35 | 0,41 | 0,48 | 0,53 |
14 | 0,29 | 0,35 | 0,41 | 0,45 |
16 | 0,28 | 0,33 | 0,39 | 0,43 |
18 | 0,26 | 0,31 | 0,37 | 0,41 |
20 | 0,26 | 0,30 | 0,36 | 0,39 |
30 | 0,22 | 0,26 | 0,31 | 0,34 |
Пользуясь критерием Шарлье, отбрасывают результат, для значения которого в ряду из n наблюдений выполняется неравенство |хi - х?| > КШSx .
Вариационный критерий Диксонаудобный и достаточно мощный (с малыми вероятностями ошибок). При его применении полученные результаты наблюдений записывают в вариационный возрастающий ряд х1, х2, . . ., xn (x1 < х2 < . . .< хп). Критерий Диксона определяется как КД = (хn - xn-1/(xn –x1). Критическая область для этого критерия Р(КД > Zq) = q. Значения Zf( приведены в табл. 3.
Пример 2. Было проведено пять измерений напряжения в электросети. Получены следующие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) отличается от остальных. Проверить, не является ли он промахом.
Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона
Кд = (127,6 - 127,2) / (127,6 - 126,9) = 0,4 / 0,7 » 0,57.
Как следует из табл.3, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q= 0,10.
|
|
Критерий Граббса (Смирнова)
(5)
где хс - результат измерения, вызывающий сомнение; х - среднее арифметическое значение ряда измерений; ах - среднее квадратичное отклонение результатов измерения.
Критическая область значений этого критерия определяется как
(6)
Значение для случая нормального закона распределения результатов измерения в зависимости от уровня значимости и количества наблюдений можно вычислить по формулам
(для 3 < п < 25).
Если при выбранном уровне значимости ц и числе наблюдений п критерий К,> Zv, то результат отбрасывают как содержащий грубую погрешность.
Порядок обнаружения и исключения грубых погрешностей и промахов с использованием критерия Граббса (Смирнова) сводится к следующему:
- определяется среднее значение результатов измерения
(7)
- определяется оценка среднего квадратичного отклонения 5(дг)
(8)
- принимается уровень значимости из ряда: 0,001; 0,025; 0,05; 0,1;
- определяется расчетное (критическое) значение критерия Граббса (Смирнова) по одному из уравнений (3) – (6) для принятого уровня значимости ц - Zff я;
- определяется критерий Греббса (Смирнова) по формуле (1)
(9)
- сравниваются значения и Zч:
если К[> Zv, то результат отбрасывают как содержащий грубую погрешность;
если Кг< то результат не содержит грубой ошибки с принятой вероятностью Р = I - а.
Критерий Шовенеиспользуется для оценки на грубую погрешность одного сомнительного значения выборки из нормально распределённой случайной величины . Иногда указывают, что критерий Шовене применим для выборок объёмом n не боьше 10 или 20.
Алгоритм критерия Шовене, можно интерпретировать так:
1). Находят модуль приведённого сомнительного значения t:
t = |хс - хср|/s (10)
Здесь хс - сомнительное значение (наибольшее или наименьшее в выборке), хср - среднее значение выборки, s - выборочное среднеквадратическое отклонение
2). Определяют значение интегральной функции стандартного нормального распределения F(t).
3). Рассчитывают вероятность Рпрев получения результата, который по модулю превышает модуль хс:
Рпрев = (1 – F(t))•2 (11)
4). Находят ожидаемое число результатов N, отклоняющихся при данном объёме выборки n от среднего значения больше, чем хс :
N = Рпрев•n (12)
Если N < 0,5, сомнительное значение считают грубой ошибкой. В зависимости от решаемой измерительной задачи экспериментатор может использовать иное значение N.
В литературе встречаются и другие алгоритмы применения критерия Шовене, которые дают аналогичные результаты.
Преимущество критерия Шовене состоит в том, что нет надобности в таблице критических значений.
Недостатки критерия Шовене:
1). Для критическоих значений N, в частности, для 0,5, в литературе отсутствуют уровни значимости, что снижает информативность критерия.
2). Возможность использовать значение N по выбору экспериментатора без учёта уровня значимости, несомненно, повышает субъективность критерия.
Задачи исследования.
1). Найти уровни значимости для критерия Шовене при критических значениях N в пределах от 0,2 до 0,8 при шаге варьирования 0,1.
2). Найти критические значения N при общепринятых ("стандартных") уровнях значимости.
Результаты исследования.
Выражение (12) с учётом (11) можно представить в виде
1 – F(t) = N/2n (13)
Выражение (1) для t представляет собой расчётную формулу для критерия Н.В. Смирнова (Граббса). Следовательно, критерий Шовене сводится к критерию Н.В. Смирнова, но при иных значениях процентных точек. Если подставить в выражение (13) какие-либо значения nи N, можно найти критическое значение t, соответствующее процентной точке критерия Н.В. Смирнова при некотором уровне значимости α, а также выбранному N. Уровень значимости, в принципе, можно найти из таблицы процентных точек критерия Н.В.Смирнова по критическому значению t и объёму выборки n. Однако при округлённых значениях N, равных 0,5 или других, получаются значения t, не соответствующие общепринятым ("стандартным") уровням значимости, и отсутствующие в таблице процентных точек критерия Н.В.Смирнова. Поэтому уровни значимости были рассчитаны методом статистического компьютерного моделирования в MS Excel для максимальных значений выборки. Легко показать, что для минимальных значений выборки уровни значимости будут такими же. Моделировали 106 выборок. Результаты приведены в таблице 4. Прочерки в таблице 4 означают, что уровень значимости меньше 0,000001, т.е. все полученные при моделировании значения N были больше того, по которому определяли уровень значимости.
Таблица 4- Уровни значимости критерия Шовене в зависимости от N и n.
n |
N |
||||
0,2 | 0,3 | 0,4 | 0,5 | 0,6 | |
3 | - | - | - | - | - |
4 | - | - | - | - | 0,080 |
5 | - | - | 0,009 | 0,068 | 0,139 |
6 | - | 0,007 | 0,045 | 0,098 | 0,159 |
7 | 0,002 | 0,024 | 0,064 | 0,114 | 0,169 |
8 | 0,008 | 0,036 | 0,077 | 0,125 | 0,177 |
9 | 0,014 | 0,045 | 0,086 | 0,132 | 0,183 |
10 | 0,019 | 0,052 | 0,092 | 0,138 | 0,187 |
11 | 0,024 | 0,057 | 0,098 | 0,143 | 0,191 |
12 | 0,027 | 0,062 | 0,103 | 0,147 | 0,195 |
13 | 0,031 | 0,066 | 0,106 | 0,151 | 0,198 |
14 | 0,034 | 0,069 | 0,109 | 0,154 | 0,200 |
15 | 0,036 | 0,072 | 0,113 | 0,157 | 0,202 |
16 | 0,039 | 0,075 | 0,116 | 0,159 | 0,204 |
17 | 0,041 | 0,078 | 0,119 | 0,162 | 0,207 |
18 | 0,043 | 0,080 | 0,121 | 0,164 | 0,208 |
19 | 0,044 | 0,081 | 0,124 | 0,166 | 0,210 |
20 | 0,046 | 0,083 | 0,125 | 0,167 | 0,211 |
30 | 0,056 | 0,095 | 0,136 | 0,178 | 0,221 |
40 | 0,063 | 0,103 | 0,144 | 0,185 | 0,226 |
50 | 0,067 | 0,108 | 0,149 | 0,190 | 0,230 |
60 | 0,070 | 0,111 | 0,152 | 0,192 | 0,233 |
70 | 0,072 | 0,113 | 0,154 | 0,195 | 0,235 |
80 | 0,074 | 0,115 | 0,156 | 0,197 | 0,237 |
90 | 0,076 | 0,117 | 0,158 | 0,199 | 0,239 |
100 | 0,077 | 0,119 | 0,160 | 0,201 | 0,240 |
Как видно из таблицы 4, уровни значимости для критерия Шовене заметно зависят как от критического значения N, так и от объёма выборки n. Таблицей 6 можно пользоваться, выбирая необходимое значение N так, чтобы уровень значимости был близок к оптимальному для решения конкретной измерительной задачи.
Но традиционный подход к применению статистических критериев состоит в том, что задаются некоторым приемлемым в конкретном случае уровнем значимости из ряда общепринятых («стандартных»), находят табличное значение критерия при этом уровне значимости, и по этому значению дают ту или иную статистическую оценку. Поэтому были рассчитаны критические значения N при общепринятых уровнях значимости для различных объёмов выборок n. Расчёт проводили, исходя из выражения (4), в которое подставляли различные значения n и соответствующие t, равные табличным значениям критерия Н.В.Смирнова (Граббса) при выбранном уровне значимости, приведённым в [13]. Результаты показаны в таблице 5.
Таблица 5. Критические значения N в зависимисти от объёма выборки и уровня значимости.
n |
Уровень значимости α |
||
0,01 | 0,05 | 0,1 | |
3 | 0,744 | 0,747 | 0,753 |
4 | 0,543 | 0,574 | 0,617 |
5 | 0,401 | 0,473 | 0,546 |
6 | 0,311 | 0,411 | 0,503 |
7 | 0,252 | 0,368 | 0,473 |
8 | 0,211 | 0,337 | 0,450 |
9 | 0,182 | 0,314 | 0,432 |
10 | 0,160 | 0,296 | 0,418 |
11 | 0,143 | 0,280 | 0,405 |
12 | 0,129 | 0,268 | 0,394 |
13 | 0,119 | 0,257 | 0,385 |
14 | 0,110 | 0,248 | 0,377 |
15 | 0,102 | 0,240 | 0,370 |
16 | 0,096 | 0,233 | 0,363 |
17 | 0,091 | 0,227 | 0,356 |
18 | 0,086 | 0,221 | 0,352 |
19 | 0,082 | 0,215 | 0,346 |
20 | 0,079 | 0,211 | 0,342 |
30 | 0,057 | 0,182 | 0,311 |
40 | 0,048 | 0,166 | 0,293 |
50 | 0,042 | 0,156 | 0,282 |
60 | 0,039 | 0,149 | 0,173 |
70 | 0,036 | 0,144 | 0,267 |
80 | 0,034 | 0,140 | 0,263 |
90 | 0,033 | 0,137 | 0,259 |
100 | 0,032 | 0,134 | 0,255 |
Таблицей 5 можно пользоваться, выбирая некоторый уровень значимости и находя по нему критическое значение N. По выбранному N сомнительные значения можно оценивать на грубые погрешности в соответствии с критерием Шовене.
Поскольку критерии Шовене и Н.В.Смирнова дают аналогичные результаты (при одинаковых уровнях значимости), нет оснований ограничивать область применения критерия Шовене небольшими объёмами выборок.
Часть информации взято из: http://arhiuch.ru/st3.html
Дата добавления: 2018-02-28; просмотров: 3552; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!