Вычислить среднюю арифметическую по данным предыдущих заданий



 

6.8. Меры вариации (рассеяния). Дисперсия и ее свойства

Пример 6.8. Рассмотрим два вариационных ряда:

Ряд I: 1, 2, 3,4, 5,6, 6,7, 8,9, 10, 11.

Ряд II: 4, 5, 5, 6, 6, 6, 6, 7, 1, 7, 8.

Оба ряда имеют одинаковое число наблюдений п = 12 и одинаковые значения средней арифметической равные 6. Но мы ясно видим, что ряды различны. В чем же суть различий между ними? Графическое изображение ряда I и ряда II показано на рис 13.7. Оба ряда имеют одинаковую центральную тенденцию. Однако значения признаков в первом ряду более широко разбросаны: они лежат дальше от средней по сравнению со вторым рядом, т. е. вариация признака в первом ряду значительнее, чем во втором. Ряд I более вариабелен, чем ряд II.

Ряд I:

*     *     *     *     *     *     *     *     *     *     *

1     2     3     4     5     6     7     8     9     10   11

Средняя = 6

Ряд II:

*

*     *     *

*     *     *

*     *     *     *     *

4     5     6     7     8

Средняя = 6

Рис. 6.6. Сравнение вариации рядов I и II

В статистике используется ряд мер вариабельности (колеблемости).

Размах вариации в ряду - разность между наибольшим и наименьшим значениями признака.

Размах вариации в первом ряду, наибольшее значение признака минус наименьшее значение признака =11 - 1 = 10.

Размах вариации во втором ряду: наибольшее значение признака минус наименьшее значение признака = 8 – 4 = 4. Размах вариации первого набора больше, чем размах вариации второго набора данных, т. е. первый набор - более вариабельный, что также видно и на рис. 6.6.

Размах вариации - мера разброса признаков в наборе данных. Существуют и другие более часто используемые меры вариации. Это - среднее линейное отклонение, дисперсия и стандартное отклонение (или среднее квадратическое отклонение), которые подобно средней используют всю информацию, содержащуюся в вариационном ряду. (Размах вариации содержит информацию только о расстоянии между наибольшим и наименьшим значениями).

Пример 6.9. Обсудим расчет дисперсии и среднего квадратического (стандартного) отклонения на данных примера 6.1. Мы можем определить вариацию как среднее значение отклонений каждого из вариантов от средней арифметической. Однако сумма отклонений всех вариантов от их средней арифметической, согласно свойству средней арифметической, всегда будет равна нулю. Поэтому для нахождения меры вариации можно возвести в квадрат каждое отклонение от средней; это изменяет отрицательные знаки отклонений на положительные, и теперь вариация не равна нулю. Сложим полученные значения и разделим сумму на число вариантов ряда. Полученная мера - средняя арифметическая квадратов отклонений, называемая в статистике дисперсией.

Таблица 6.8. Расчет дисперсии по данным примера 6.1

xi ni xini xi - (xi - ) ni (xi - )2ni
9 1 9 -6,5 -6,5 42,25
12 2 24 -3,5 -7,0 24,50
13 3 39 -2,5 -7,5 18,75
14 6 84 -1,5 -9,0 13,50
15 5 75 -0,5 -2,5 1,25
16 3 48 0,5 1,5 0,75
17 2 34 1,5 3,0 4,50
19 1 19 3,5 3,5 12,25
21 1 21 5,5 5,5 20,25
23 1 23 7,5 7,5 56,25
27 1 27 11,5 11,5 132,25
S 26 403 0 0 336,5

 

Для окончательного расчета дисперсии сумму в последнем столбце необходимо разделить на сумму во втором столбце:

s2 = 336,5/26 » 12,94.

Дадим определение дисперсии.

Дисперсия вариационного ряда есть средняя арифметическая квадрата отклонения (средний квадрат отклонения) значений признаков ряда от их средней арифметической:

для взвешенных вариантов        для невзвешенных вариантов

   (6.11)                                       (6.12)

Определим теперь стандартное отклонение (среднее квадратическое отклонение):

Стандартное отклонение вариационного ряда есть арифметическое значение корня квадратного из дисперсии.

                                                           (6.13)

s =  » 3,5975 или, округляя до двух знаков, - s » 3,60.

Для чего мы используем стандартное отклонение, если уже имеем такую меру вариации признаков, как дисперсия? Желательно, чтобы показатель рассеяния выражался в тех же единицах, что и значение признака (дисперсия этим свойством не обладает). Извлекая квадратный корень из дисперсии, мы получаем показатель, имеющий ту же единицу измерения, что и анализируемый признак.

В чем смысл дисперсии и среднего квадратического отклонения ? Как мы можем интерпретировать их значения? По определению s2 - средний квадрат отклонений вариантов от средней арифметической, это - мера рассеяния всех значений вариантов относительно средней арифметической. Чем больше вариация, тем дальше от средней находятся возможные значения признаков. Если сравнивают два вариационных ряда, то тот из них, который имеет большую дисперсию и среднее квадратическое отклонение, более вариабелен. Риск, ассоциируемый с инвестициями, часто измеряют стандартным отклонением возврата инвестиций. Если сравниваются два типа инвестиций с одинаковой ожидаемой средней возврата, то инвестиции с более высоким средним квадратическим отклонением считаются более рискованными (хотя более высокое стандартное отклонение предполагает возврат, более вариабельный с обеих сторон - как ниже, так и выше средней).

В научном анализе предпочтительно использование дисперсии, так как она имеет ряд полезных математических свойств, на практике же лучше работать со стандартным отклонением, поскольку эта мера легко интерпретируется.

Если мы имеем калькулятор со статистическими функциями или компьютер, то формулы (6.11) и (6.12) устроят нас, но для ручного счета они неудобны. Для ручного счета лучше пользоваться формулой дисперсии следующего вида, которая легко выводится из формулы (6.11):

s2 =  - ( )2,                                                      (6.14)

где  = .

Составим таблицу, чтобы облегчить вычисления (табл. 6.9).

Таблица 6.9. Расчет дисперсии для данных примера 13.1 по формуле (6.14)

xi ni xini xi2ni
9 12 13 14 15 16 17 19 21 23 27 1 2 3 6 5 3 2 1 1 1 1 9 24 39 84 75 48 34 19 21 23 27 81 288 507 1176 1125 768 578 361 441 529 729
S 26 403 6583

 

Используя формулу (6.14), имеем:

s2 =  - ( )2 = (6583/26) - (15,5)2 = 253,19 - 240,25 = 12,94.

Свойства дисперсии

1. Дисперсия постоянной величины равна нулю.

2. Если все значения вариантов уменьшить на постоянную величину то дисперсия не изменится.

 =                                                              (6.15)

Пример 6.10. На данных примера 6.1 (см. табл. 6.2) убедимся, что если все значения вариантов уменьшить на постоянную величину 14, то дисперсия не изменится. Для этого составим рабочую таблицу (табл. 6.10):

Таблица 6.10. Рабочая таблица

xi ni xi - 14 (xi -14) ni (xi -14)2ni
9 1 -5 -5 25
12 2 -2 -4 8
13 3 -1 -3 3
14 6 0 0 0
15 5 1 5 5
16 3 2 6 12
17 2 3 6 18
19 1 5 5 25
21 1 7 7 49
23 1 9 3 81
27 1 13 13 169
S 26 - 39 395

 

 = 39/26 = 1,5;

 =  -  = 395/26 - 1,52 = 12,94 = .

3. Если все значения вариантов увеличить (уменьшить) в r раз, то дисперсия увеличится (уменьшится) в r2 раз. (r – может быть как положительным, так и отрицательным числом.)

 =  или  = r2.                                              (6.16)

Пример 6.11. На данных примера 6.1 (табл. 6.2) убедимся, что если все значения вариантов увеличить в два раза, то дисперсия увеличится в четыре раза.

Таблица 6.11. Иллюстрация третьего свойства дисперсии

xi ni 2xi (2xi)ni (2xi)2ni
9 1 18 18 324
12 2 24 48 1152
13 3 26 78 2028
14 6 28 168 4704
15 5 30 150 4500
16 3 32 96 3072
17 2 34 68 2312
19 1 38 38 1444
21 1 42 42 1764
23 1 46 46 2116
27 1 54 54 2916
S 26 S 806 26332

 

Вычислим искомую дисперсию по формуле (6.14):  =  -  = 26332/26 - (806/26)2 = 51,7692, т.е.  = 22

ЗАДАНИЕ


Дата добавления: 2020-11-29; просмотров: 110; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!