Значения критерия Романовского

Критерии исключения грубых погрешностей

При однократных измерениях обнаружить промах не представляется возможным. Для уменьшения вероятности появления промахов измерения проводят два-три раза и за результат принимают среднее арифметическое полученных отсчетов. При многократных измерениях для обнаружения промахов используют статистические критерии, предварительно определив, какому виду распределения соответствует результат измерений.

Для выявления грубых погрешностей задаются вероятностью q (уровнем значимости) того, что сомнительный результат действительно мог иметь место в данной совокупности результатов измерений.

Критерий "трех сигм"применяется для результатов измерений, распределенных по нормальному закону. По этому критерию считается, что результат, возникающий с вероятностью q < 0,003, маловероятен и его можно считать промахом, если |х? -хi| > 3Sx , где Sx — оценка СКО измерений. Величины х и Sx вычисляют без учета экстремальных значений xi. Данный критерий надежен при числе измерений n > 20... 50.

Это правило обычно считается слишком жестким, поэтому рекомендуется назначать границу цензурирования в зависимости от объема выборки: при

6 < n < 100 она равна 4Sx; при 100 < n < 1000 - 4,5Sx; при 1000 < n < 10000 - 5Sx. Данное правило также применимо только для нормального закона.

В общем случае границы цензурирования trpSx выборки зависят не только от объема n, но и от вида распределения. Назначая ту или иную границу, необходимо оценить уровень значимости q, т.е. вероятность исключения какой-либо части отсчетов, принадлежащих обрабатываемой выборке. Приводится выражение для приближенного расчета коэффициента trp при уровне значимости q < l/(n + 1):

(4)

где e — эксцесс распределения. Данные выражения применимы для:

• кругловершинных двухмодальных распределений с e = 1,5,..., 3, являющихся композицией дискретного двузначного и нормального распределений;

• островершинных двухмодальных распределений с e = 1,5,..., 6, являющихся композицией дискретного двузначного распределения и распределения Лапласа;

• композиций равномерного и экспоненциальных распределений с показателем степени a = 1/2 при e = 1,8,...,6;

• экспоненциальных распределений с e = 1,5,...,6.

Критерий Романовскогоприменяется, если число измерений n < 20. При этом вычисляется отношение |(х? - xi)/SX| = b и сравнивается с критерием bт, выбранным по табл. 1. Если b ³ bт, то результат хi считается промахом и отбрасывается.

Пример 1. При диагностировании топливной системы автомобиля результаты пяти измерений расхода топлива составили: 22, 24, 26, 28, 30 л на 100 км. Последний результат вызывает сомнение. Проверить по критерию Романовского, не является ли он промахом.

Найдем среднее арифметическое значение расхода топлива и его СКО без учета последнего результата, т.е. для четырех измерений. Они соответственно равны 25 и 2,6 л на 100 км.

Поскольку n < 20, то по критерию Романовского при уровне значимости 0,01 и n = 4 табличный коэффициент bт = 1,73. Вычисленное для последнего, пятого измерения b = |(25 30)|/2,6 = 1,92 > 1,73 .

Критерий Романовского свидетельствует о необходимости отбрасывания последнего результата измерения.

Критерий Шарльеиспользуется, если число наблюдений в ряду велико (n> 20). Тогда по теореме Бернулли число результатов, превышающих по абсолютному значению среднее арифметическое значение на величину КШSx, будет n[l - Ф(КШ)], где Ф(КШ) — значение нормированной функции Лапласа для X = КШ. Если сомнительным в ряду результатов наблюдений является один результат, то n[1-Ф(Кш)] = 1. Отсюда Ф(КШ) = (n -1)/n.

Значения критерия Шарлье приведены в табл. 2.

Таблица 1

Значения критерия Романовского

q n =4 n = 6 n = 8 n = 10 n = 12 n = 15 n = 20
0,01 1,73 2,16 2,43 2,62 22,75 2,90 3,08
0,02 1,72 2,13 2,37 2,54 2,66 2,80 2,96
0,05 1,71 2,10 2,27 2,41 2,52 2,64 2,78
0,10 1,69 2,00 2,17 2,29 2,39 2,49 2,62

 

Таблица 2

Значения критерия Шарльe

п 5 10 20 30 40 50 100
Кщ 1,3 1,65 1.96 2,13 2,24 2,32 2,58

 

Таблица 3

Значения критерия Диксона

n

Zq при q, равном

0,10 0,05 0,02 0,01
4 0,68 0,76 0,85 0,89
6 0,48 0,56 0,64 0,70
8 0,40 0,47 0,54 0,59
10 0,35 0,41 0,48 0,53
14 0,29 0,35 0,41 0,45
16 0,28 0,33 0,39 0,43
18 0,26 0,31 0,37 0,41
20 0,26 0,30 0,36 0,39
30 0,22 0,26 0,31 0,34

Пользуясь критерием Шарлье, отбрасывают результат, для значения которого в ряду из n наблюдений выполняется неравенство |хi - х?| > КШSx .

Вариационный критерий Диксонаудобный и достаточно мощный (с малыми вероятностями ошибок). При его применении полученные результаты наблюдений записывают в вариационный возрастающий ряд х1, х2, . . ., xn (x1 < х2 < . . .< хп). Критерий Диксона определяется как КД = (хn - xn-1/(xn –x1). Критическая область для этого критерия Р(КД > Zq) = q. Значения Zf( приведены в табл. 3.

Пример 2. Было проведено пять измерений напряжения в электросети. Получены следующие данные: 127,1; 127,2; 126,9; 127,6; 127,2 В. Результат 127,6 В существенно (на первый взгляд) отличается от остальных. Проверить, не является ли он промахом.

Составим вариационный ряд из результатов измерений напряжения в электросети: 126,9; 127,1; 127,2; 127,2; 127,6 В. Для крайнего члена этого ряда (127,6 В) критерий Диксона

Кд = (127,6 - 127,2) / (127,6 - 126,9) = 0,4 / 0,7 » 0,57.

Как следует из табл.3, по этому критерию результат 127,6 В может быть отброшен как промах лишь на уровне значимости q= 0,10.

Критерий Граббса (Смирнова)

(5)

где хс - результат измерения, вызывающий сомнение; х - среднее арифметическое значение ряда измерений; ах - среднее квадратичное отклонение результатов измерения.

Критическая область значений этого критерия определяется как

(6)

Значение  для случая нормального закона распределения результатов измерения в зависимости от уровня значимости и количества наблюдений можно вычислить по формулам

(для 3 < п < 25).

Если при выбранном уровне значимости ц и числе наблюдений п критерий К,> Zv, то результат отбрасывают как содержащий грубую погрешность.

Порядок обнаружения и исключения грубых погрешностей и промахов с использованием критерия Граббса (Смирнова) сводится к следующему:

- определяется среднее значение результатов измерения

(7)

- определяется оценка среднего квадратичного отклонения 5(дг)

(8)

- принимается уровень значимости из ряда: 0,001; 0,025; 0,05; 0,1;

- определяется расчетное (критическое) значение критерия Граббса (Смирнова) по одному из уравнений (3) – (6) для принятого уровня значимости ц - Zff я;

- определяется критерий Греббса (Смирнова) по формуле (1)

(9)

- сравниваются значения и Zч:

если К[> Zv, то результат отбрасывают как содержащий грубую погрешность;

если Кг< то результат не содержит грубой ошибки с принятой вероятностью Р = I - а.

 

Критерий Шовенеиспользуется для оценки на грубую погрешность одного сомнительного значения выборки из нормально распределённой случайной величины . Иногда указывают, что критерий Шовене применим для выборок объёмом n не боьше 10 или 20.

Алгоритм критерия Шовене, можно интерпретировать так:

1). Находят модуль приведённого сомнительного значения t:

t = |хс - хср|/s (10)

Здесь хс - сомнительное значение (наибольшее или наименьшее в выборке), хср - среднее значение выборки, s - выборочное среднеквадратическое отклонение

2). Определяют значение интегральной функции стандартного нормального распределения F(t).

3). Рассчитывают вероятность Рпрев получения результата, который по модулю превышает модуль хс:

Рпрев = (1 – F(t))•2 (11)

4). Находят ожидаемое число результатов N, отклоняющихся при данном объёме выборки n от среднего значения больше, чем хс :

N = Рпрев•n (12)

Если N < 0,5, сомнительное значение считают грубой ошибкой. В зависимости от решаемой измерительной задачи экспериментатор может использовать иное значение N.

В литературе встречаются и другие алгоритмы применения критерия Шовене,  которые дают аналогичные результаты.

Преимущество критерия Шовене состоит в том, что нет надобности в таблице критических значений.

Недостатки критерия Шовене:

1). Для критическоих значений N, в частности, для 0,5, в литературе отсутствуют уровни значимости, что снижает информативность критерия.

2). Возможность использовать значение N по выбору экспериментатора без учёта уровня значимости, несомненно, повышает субъективность критерия.

Задачи исследования.

1). Найти уровни значимости для критерия Шовене при критических значениях N в пределах от 0,2 до 0,8 при шаге варьирования 0,1.

2). Найти критические значения N при общепринятых ("стандартных") уровнях значимости.

Результаты исследования.

Выражение (12) с учётом (11) можно представить в виде

1 – F(t) = N/2n (13)

Выражение (1) для t представляет собой расчётную формулу для критерия Н.В. Смирнова (Граббса). Следовательно, критерий Шовене сводится к критерию Н.В. Смирнова, но при иных значениях процентных точек. Если подставить в выражение (13) какие-либо значения nи N, можно найти критическое значение t, соответствующее процентной точке критерия Н.В. Смирнова при некотором уровне значимости α, а также выбранному N. Уровень значимости, в принципе, можно найти из таблицы процентных точек критерия Н.В.Смирнова по критическому значению t и объёму выборки n. Однако при округлённых значениях N, равных 0,5 или других, получаются значения t, не соответствующие общепринятым ("стандартным") уровням значимости, и отсутствующие в таблице процентных точек критерия Н.В.Смирнова. Поэтому уровни значимости были рассчитаны методом статистического компьютерного моделирования в MS Excel для максимальных значений выборки. Легко показать, что для минимальных значений выборки уровни значимости будут такими же. Моделировали 106 выборок. Результаты приведены в таблице 4. Прочерки в таблице 4 означают, что уровень значимости меньше 0,000001, т.е. все полученные при моделировании значения N были больше того, по которому определяли уровень значимости.

Таблица 4- Уровни значимости критерия Шовене в зависимости от N и n.

n

N

0,2 0,3 0,4 0,5 0,6
3 - - - - -
4 - - - - 0,080
5 - - 0,009 0,068 0,139
6 - 0,007 0,045 0,098 0,159
7 0,002 0,024 0,064 0,114 0,169
8 0,008 0,036 0,077 0,125 0,177
9 0,014 0,045 0,086 0,132 0,183
10 0,019 0,052 0,092 0,138 0,187
11 0,024 0,057 0,098 0,143 0,191
12 0,027 0,062 0,103 0,147 0,195
13 0,031 0,066 0,106 0,151 0,198
14 0,034 0,069 0,109 0,154 0,200
15 0,036 0,072 0,113 0,157 0,202
16 0,039 0,075 0,116 0,159 0,204
17 0,041 0,078 0,119 0,162 0,207
18 0,043 0,080 0,121 0,164 0,208
19 0,044 0,081 0,124 0,166 0,210
20 0,046 0,083 0,125 0,167 0,211
30 0,056 0,095 0,136 0,178 0,221
40 0,063 0,103 0,144 0,185 0,226
50 0,067 0,108 0,149 0,190 0,230
60 0,070 0,111 0,152 0,192 0,233
70 0,072 0,113 0,154 0,195 0,235
80 0,074 0,115 0,156 0,197 0,237
90 0,076 0,117 0,158 0,199 0,239
100 0,077 0,119 0,160 0,201 0,240

Как видно из таблицы 4,  уровни значимости для критерия Шовене заметно зависят как от критического значения N, так и от объёма выборки n. Таблицей 6 можно пользоваться, выбирая необходимое значение N так, чтобы уровень значимости был близок к оптимальному для решения конкретной измерительной задачи.

Но традиционный подход к применению статистических критериев состоит в том, что задаются некоторым приемлемым в конкретном случае уровнем значимости из ряда общепринятых («стандартных»), находят табличное значение критерия при этом уровне значимости, и по этому значению дают ту или иную статистическую оценку. Поэтому были рассчитаны критические значения N при общепринятых уровнях значимости для различных объёмов выборок n. Расчёт проводили, исходя из выражения (4), в которое подставляли различные значения n и соответствующие t, равные табличным значениям критерия Н.В.Смирнова (Граббса) при выбранном уровне значимости, приведённым в [13]. Результаты показаны в таблице 5.

Таблица 5. Критические значения N в зависимисти от объёма выборки и уровня значимости.

n

Уровень значимости α

0,01 0,05 0,1
3 0,744 0,747 0,753
4 0,543 0,574 0,617
5 0,401 0,473 0,546
6 0,311 0,411 0,503
7 0,252 0,368 0,473
8 0,211 0,337 0,450
9 0,182 0,314 0,432
10 0,160 0,296 0,418
11 0,143 0,280 0,405
12 0,129 0,268 0,394
13 0,119 0,257 0,385
14 0,110 0,248 0,377
15 0,102 0,240 0,370
16 0,096 0,233 0,363
17 0,091 0,227 0,356
18 0,086 0,221 0,352
19 0,082 0,215 0,346
20 0,079 0,211 0,342
30 0,057 0,182 0,311
40 0,048 0,166 0,293
50 0,042 0,156 0,282
60 0,039 0,149 0,173
70 0,036 0,144 0,267
80 0,034 0,140 0,263
90 0,033 0,137 0,259
100 0,032 0,134 0,255

Таблицей 5 можно пользоваться, выбирая некоторый уровень значимости и находя по нему критическое значение N. По выбранному N сомнительные значения можно оценивать на грубые погрешности в соответствии с критерием Шовене.

Поскольку критерии Шовене и Н.В.Смирнова дают аналогичные результаты (при одинаковых уровнях значимости), нет оснований ограничивать область применения критерия Шовене небольшими объёмами выборок.

 

Часть информации взято из: http://arhiuch.ru/st3.html


Дата добавления: 2018-02-28; просмотров: 3552; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!