ТЕМА 2 «Показатели вариации»  



Кубанский государственный университет

Кафедра экономического анализа, статистики и финансов

 

Методический материал

По дисциплине

«Теория статистики»

 

Составитель – к.э.н., доцент Бабенко И.В.

 

Краснодар 2018

ТЕМА 1 «Статистическое изучение вариационных рядов»

Общие сведения о вариационных рядах, их построение

 

Статистические ряды подразделяются на два вида: ряды распределения и ряды динамики.

Ряды распределения представляют собой ряды чисел, характеризующих состав или структуру какого-либо явления или процесса после группировки статистических данных. Ряды распределения подразделяются на атрибутивные и вариационные. Вариационные ряды, в свою очередь, могут быть дискретными и интервальными. В дискретном ряду группировочный признак изменяется прерывно, как правило, целыми числами.

В интервальном ряду группировочный признак принимает любые числовые значения в пределах интервала. Интервалы, в свою очередь, могут быть равновеликими и неравновеликими.

Вариационный ряд представляет собой две строки (или две колонки), в одной из которых приводятся отдельные значения варьирующего признака, которые называются вариантами и обозначаются символом x, а в другой строке – абсолютные числа, показывающие, сколько раз встречается тот или иной вариант. Эти показатели второй строки (колонки) называются частотами и обозначаются обычно через m(f).

Во второй строке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Их именуют частостями и обозначают w . Сумма всех частостей равна 1 (или 100%).

Пример атрибутивного ряда:

Крупнейшие производители мобильных телефонов в 2012 г., доля на мировом рынке в процентах

Samsung Nokia Apple ZTE LG Прочие Итого
23,7 19,6 8,0 3,8 3,3 41,6 100

Несгруппированные данные:

Ежедневный товарооборот, тыс. руб. (Величина уплаченных штрафов)

20 20 15 20 17 18 23 20 24 25 17 

 

Дискретный вариационный ряд:

x 15 17 18 20 23 24 25 Итого
m 1 2 1 4 1 1 1 11
S 1 1+2=3 3+1=4 4+4=8 8+1=9 9+1=10 10+1=11

 

Интервальный вариационный ряд (равновеликий):

x 13-15 16-18 19-21 22-24 свыше 24 Итого
m 1 3 4 2 1 11
w (9%) (27%) (37%) (18%) (9%) 1,00   (100%)  

 

Для целых чисел признака границы интервалов могут не пересекаться, а для дробных – пересекаются во всех случаях.

 

Основные характеристики вариационного ряда

 

Средняя арифметическая. Для несгруппированных данных средняя арифметическая рассчитывается по формуле:

, где n – число значений признака (вариантов)

и называется средней арифметической простой.

Для дискретного вариационного ряда (где данные уже сгруппированы) рассчитывается средняя арифметическая взвешенная:

, где m, f – веса.

Понятие «вес» не всегда связано с подсчётом частот вариантов, и, следовательно, с вариационными рядами.

Для интервального вариационного ряда для исчисления  предварительно в каждом интервале определяется его середина, которая принимается за конкретное значение признака и умножается на соответствующую частоту. Середина интервала определяется как полусумма нижней и верхней границ интервала. Если у первого интервала нет нижней границы, а у последнего – верхней, то эти границы устанавливаются условно, полагая, что первый интервал по величине равен следующему за ним, а последний – предшествующему.

 

Важнейшее свойство средней арифметической: сумма отклонений вариантов от своей средней арифметической равна нулю

.

 

Средняя гармоническая.

Средняя гармоническая простая , где  – обратные значения вариантов.

Средняя гармоническая взвешенная , где M – веса.

Применение средней арифметической или средней гармонической определяется наличием данных и исходным статистическим соотношением (ИСС).

Кроме вышеуказанных средних, рассчитываются и структурные средние:

 

Мода (Мо) – это наиболее часто встречающееся значение признака у единиц совокупности. Для дискретных рядов – это вариант, имеющий наибольшую частоту (для наших данных Мо=20 тыс. руб.).

В интервальных вариационных рядах вначале по наибольшей частоте определяют интервал, в котором находится мода – модальный интервал. Для рядов с равными интервалами мода определяется по следующей формуле:

,

где – нижняя граница модального интервала; i – величина модального интервала; – частота (частость) предмодального интервала; – частота модального интервала; – частота послемодального интервала.

 

.

В ряду с неравными интервалами Мо определяется в интервале, имеющем наибольшую плотность распределения, и в формуле вместо частот принимаются соответствующие плотности распределения. Плотность распределения рассчитывается делением количества единиц в интервале на величину интервала.

Медиана (Ме) – это значение признака у средней единицы ранжированного ряда. Ранжированным называется ряд, у которого значения признака расположены в порядке возрастания или убывания.

Для нахождения медианы в случае несгруппированных данных вначале определяют её порядковый номер: . Если n – нечётное число, то в центре ряда находится одно значение признака, и оно будет являться медианой; если же n – чётное число, то в центре ряда стоят два варианта, и медиану нужно определять как среднюю из величин этих вариантов.

 

15 17 17 18 20 20 20 20 23 24 25
№1 №2 №3 №4 №5 №6 №7 №8 №9 №10 №11

Для определения медианы в дискретном ряду  также находят её порядковый номер: . Далее рассчитывают накопленные частоты (частости) S путём последовательного суммирования частот всех вариантов, начиная с первого и заканчивая данным. Медианой является тот вариант, накопленная частота которого впервые больше или равна медианного номера: .

x 15 17 18 20 23 24 25 Итого
m 1 2 1 4 1 1 1 11
S 1 1+2=3 1+2+1=4 1+2+1+4=8 1+2+1+4+1=9 1+2+1+4+1+1=10 1+2+1+4+1+1+1=11

8>6 Ме=20 тыс. руб.

 

В интервальном ряду, прежде всего, находят медианный интервал; им считается тот, накопленная частота которого впервые больше или равна половины всей суммы частот .

Медиана в этом случае находится по формуле:

,

где – нижняя граница медианного интервала; d – величина медианного интервала; – сумма частот (частостей) ряда; – накопленная частота до медианного интервала; – частота медианного интервала.

ТЕМА 2 «Показатели вариации»  

1) Размах вариации R .
Этот показатель используется нечасто, т.к. учитывает только крайние значения признака, которые могут существенно отличаться от всех других единиц. Применяется для определения величины интервала, когда известно число формируемых групп:
                                              , где k – число групп;

2) Среднее линейное отклонение
 – для несгруппированных данных;
– для вариационного ряда.
Чем меньше , тем более однородна совокупность, тем более типична средняя для совокупности.
Для интервального ряда предварительно определяют середины интервалов, т.е. переходят к дискретному ряду.

3) Среднее квадратическое отклонение (стандартное отклонение) («сигма»)
– для несгруппированных данных;
– для вариационного ряда.

4) Дисперсия
 - для несгруппированных данных;

 - для вариационного ряда.
Имеется и другая формула для исчисления дисперсии:

  Дисперсия альтернативного признака: альтернативными признаками называются такие, которыми одни единицы изучаемой совокупности обладают, а другие – нет.
Пусть наличие признака обозначается 1, а его отсутствие – 0. Тогда через p обозначим долю единиц, обладающих признаком, а через q – долю единиц, этим признаком не обладающих: . Получаем дискретный вариационный ряд:

 

x 1 0 Итого:
w p q

 

Вначале определяем среднюю: .
Дисперсия в этом случае равна: .

5) Коэффициент вариации является относительным показателем вариации и представляет собой процентное отношение среднего квадратического отклонения к средней арифметической:
                                             .
Чем меньше значение v, тем однороднее совокупность, и тем точнее средняя отображает значения варьирующего признака. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

Правило сложения дисперсий

Пусть совокупность разделена на группы (части) по какому-либо изучаемому признаку. Тогда для этой совокупности могут быть определены такие виды дисперсий, как частные (групповые) дисперсии, средняя из частных дисперсий, межгрупповая и общая дисперсия.

Частная (групповая) дисперсия отражает вариацию признака только за счёт причин (факторов), действующих внутри группы; или, иначе, отражает влияние всех прочих факторов, кроме фактора, положенного в основу группировки:

                                      ,
где – средняя в i-той группе; – численность i-той группы.

Для всей совокупности измерить оценку этого влияния можно при помощи средней из частных (групповых) дисперсий (остаточная дисперсия):

                             .

Межгрупповая дисперсия характеризует вариацию признака только за счёт фактора, положенного в основу группировки:

                           ,
где – общая средняя для всей совокупности .

Между вышеуказанными видами дисперсий существует взаимосвязь, выражаемая правилом сложения дисперсий:

общая дисперсия признака в совокупности определяется как сумма межгрупповой дисперсии (вариации за счёт одного выделенного фактора) и средней из групповых дисперсий (вариации за счёт остальных факторов)

.

Это правило используется в статистике для определения степени тесноты связи между изучаемыми признаками. Вначале определяется коэффициент детерминации:

.

Он показывает, какую часть общей вариации изучаемого признака составляет вариация межгрупповая, т.е. обусловленная группировочным признаком.

Затем рассчитывают эмпирическое корреляционное отношение:

 

Данная величина характеризует тесноту связи между группировочным и результативным признаком.


Дата добавления: 2018-05-12; просмотров: 190; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!