ДИСПЕРСИЯ И СТАНДАРТНОЕ ОТКЛОНЕНИЕ
Значения отклонений, то есть значения вида , несут информацию о вариации выборочной совокупности значений. Совокупность с большой неоднородностью будет иметь несколько больших отклонений. Каковы были бы отклонения, если бы все значения и совокупности равнялись 8? Среднее было бы 8, следовательно, каждое отклонение было бы 8 – 8 = 0. В предельно однородной совокупности, которая в принципе достижима, все отклонения равны нулю. Некоторая комбинация отклонений могла бы быть полезной мерой вариации.
Если бы нам требовалось просуммировать все отклонения, то характеризовала ли бы эта сумма вариацию исходных данных? Нет, поскольку эта сумма всегда точно равна нулю:
.
Для обхода этого факта мы можем возвести в квадрат каждое отклонение и найти сумму квадратов. Следовательно, для данной совокупности мера вида
будет большой, когда данные неоднородны, и малой для однородных. Чтобы избавиться от знаков, мы могли бы обойтись без квадратов отклонений; мы могли бы просто рассматривать эти отклонения как положительные (взятые по их абсолютной величине). Это привело бы к другой мере вариации, называемой средним отклонением.
Величина суммы квадратов зависит также от того, сколько имеется данных Чем больше п, тем больше сумма. Если хотят сравнить изменчивость двух совокупностей, которые отличаются по объему, то возникает ограничение. Оно снимается после деления суммы на n-1 и называется выборочной дисперсией:
|
|
, (4.2)
где – выборочная дисперсия;
xi – значение признака;
– выборочная средняя;
n – объем выборки.
Задача 4.1
Для нахождения дисперсии группы показателей (1,3,3,0,4,7) удобно вычисления оформить в виде таблицы 4.1.
Таблица 4.1
1 | -2 | 4 |
3 | 0 | 0 |
3 | 0 | 0 |
0 | -3 | 9 |
4 | 1 | 1 |
7 | 4 | 16 |
Сумма | 0 | 30 |
При значение выборочной дисперсии находится по формуле (4.2):
.
Важная характеристика дисперсии заключается в том, что с ее помощью можно сравнивать выборки, различные по объему.
Однако сама дисперсия, как характеристика отклонения от среднего, часто неудобна для интерпретации. Так, например, предположим, что в эксперименте измерялся рост в сантиметрах, тогда размерность дисперсии будет являться характеристикой площади, а не линейного размера.
Для того чтобы приблизить размерность дисперсии к размерности измеряемого признака, применяют операцию извлечения квадратного корня из дисперсии. Полученную величину называют выборочным стандартным отклонением:
. (4.3)
Формулы (4.2) и (4.3) предназначены для вычисления статистик выборки. В них фигурируют значения: n – объем выборочной совокупности и – выборочное среднее.
|
|
Рассмотрим аналогичные формулы для вычисления соответствующих параметров генеральной совокупности.
Формула для вычисления генеральной дисперсии будет иметь вид:
, (4.4)
где s2 – генеральная дисперсия;
xi – значение признака;
m – генеральная средняя;
N – объем генеральной совокупности.
Аналогом формулы (4.3) для генеральной совокупности является
. (4.5)
Свойства дисперсии
1) Прибавление константы С к каждому значению не влияет на дисперсию:
.
2) Умножение каждого значения на С увеличивает дисперсию в С2 раз:
.
СТАНДАРТИЗИРОВАННЫЕ ДАННЫЕ
Часто желательно описать место некоторого значения в совокупности, измеряя его отклонение от среднего всех значений вединицах стандартного отклонения.
Например, данная совокупность 100 значений имеет среднее 18,75, а стандартное отклонение 2,60. Если вам известно лишь, что среди этих 100 значений есть одно, равное 20, то его относительное положение в множестве 100 значений видно не сразу.
Любое множество п данных со средним и стандартным отклонением Sx можно преобразовать в другое множество со средним 0 и стандартным отклонением 1 таким образом, что преобразованные значения будут непосредственно выражаться в отклонениях исходных значений от среднего, измеренных в единицах стандартного отклонения. Новые значения называют значениями z:
|
|
. (4.6)
Значение z не только удобное средство информации о положении некоторого значения, связанного со средним и измеренного в единицах стандартного отклонения, но и шаг вперед к преобразованию множества X в произвольную шкалу с удобными характеристиками среднего и стандартного отклонения. Сами оценки z могут не подходить для некоторых целей. Отрицательные оценки, например, могут оказаться неудобными, а множество z будет, конечно, содержать дроби. Преобразование самих z позволяет устранить эти несущественные трудности.
Известно, что значения cz, полученные умножением каждого z на константу с, будут иметь стандартное отклонение |с|, а для cz+ d среднее равно
.
Существует множество шкал измерения (произвольные средние и стандартные отклонения), которые распространены в педагогике и общественных науках. Множество данных можно расположить на любой шкале, то есть им можно приписать желаемые среднее ( d) и стандартное отклонение (с), пользуясь выражением
|
|
yi = czi + d. (4.7)
Например, оценки интеллектуального теста часто преобразуются в шкалу со средним 100 и стандартным отклонением 15 или 16. Значения Т, полученные с помощью 10z+50, находят широкое применение.
Задача 4.2
Множество значений (0, 3, 4, 5, 6, 9, 10, 12,13, 15) необходимо перевести в шкалу со средним значением 100 и стандартным отклонением 15.
Решение
Найдем среднее значение по формуле (3.2) и стандартное отклонение по формуле (4.3):
;
.
По формуле (4.6) для каждого xi найдем значение zi . Вычисление оформим в виде таблицы 4.2.
Таблица 4.2
xi | zi | yi |
0 | -1,586 | 76,208 |
3 | -0,968 | 85,478 |
4 | -0,762 | 88,567 |
5 | -0,556 | 91,657 |
6 | -0,350 | 94,747 |
9 | 0,268 | 104,017 |
10 | 0,474 | 107,107 |
12 | 0,886 | 113,287 |
13 | 1,092 | 116,376 |
15 | 1,504 | 122,556 |
Подставляя каждое полученное значение zi в формулу (4.7) и при условии, что с=15 (новое стандартное отклонение) и d=100 (новое среднее значение), мы получим значения у i в новой шкале.
ВОПРОСЫ И УПРАЖНЕНИЯ
1. Дайте определение размаху, выборочной дисперсии, генеральной дисперсии, стандартному отклонению. Воспроизведите формулы для их нахождения.
2. Что характеризует выборочная дисперсия.
3. Вычислите для множества: 22, 15, 16, 21, 24, 24, 27, 28, 30, 30, 31 , 31, 31, 34, 36 размах, дисперсию, стандартное отклонение.
4. В каких случаях можно проводить сравнение разных выборок по дисперсиям?
5. Выборочные дисперсии результатов контрольной работы в классе 7«А» и 7«Б» соответственно равны 0,44 и 1,38. Какой вывод можно сделать при сравнении результатов контрольной работы в двух классах?
6. Дисперсия каждой из групп A и В равна 5. Будет ли дисперсия 10 значений, полученных путем объединения групп, меньше, больше или равна 5?
Группа А: 13, 11, 10, 9, 7
Группа В: 28, 26, 25, 24, 22
7. Множество значений (-4, -2, 0, 1, 1, 3, 7, 12, 14, 15, 17) переведите в шкалу со средним значением 10 и стандартным отклонением 5.
ТЕМА 5
Дата добавления: 2019-09-13; просмотров: 248; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!