Показатель эксцесса (островершинности)
Семестр 1
Группировка статистических данных и ее роль в анализе информации
Равный интервал, величина интервала - , m – число групп
Формула Стерджесса (величина интервала) - , n – число наблюдений
Абсолютные, относительные, средние величины
Относительные величины
Относительные величины (ОВ) динамики характеризуют изменение явления во времени. (Коэффициент роста)
Темп роста – с переменной базой - yn– уровень явления за период(например, выпуск продукции по кварталам года)
С постоянной базой - , yk – постоянная база сравнения
ОВ планового задания -
ОВ выполнения плана -
ОВ динамики -
ОВ структуры характеризуют долю отдельных частей в общем объеме совокупности (удельный вес) -
ОВ координации отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на 10 или на 100 единиц другой изучаемой совокупности.
ОВ координации -
ОВ наглядности (сравнения) отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по 2-м предприятиям)
ОВ сравнения -
Средние величины
Степенные средние общего типового расчета:
Значе-ниеk | Наименование средней | Формула средней | |
Простая | Взвешенная | ||
-1 | Гармоническая | , | |
0 | Геометрическая | ||
1 | Арифметическая | , | |
2 | Квадратическая |
гарм. < геом< арифм< квадрат, x=w/f
|
|
Гармоническая простая – когда небольшая совокупность и индивидуальные значения не повторяются. Используется, если исчисляем среднюю из обратных величин.
Средняяквадратическая – для расчета среднего квадратического отклонения, являющегося показателем вариации признаков
Средняя геометрическая простая – для вычисления среднего коэффициента роста (темпа) в рядах динамики, если промежутки, к которым относятся коэффициенты роста, одинаковы.
Статистические распределения и их характеристики
Мода – значение признака, которое наиболее часто встречается в совокупности
, - нижняя граница модального интервала (интервал с наибольшей частотой), - величина интервала, - частота в модальном интервале.
Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.
- положение медианы
, - нижняя граница медианного интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.
Квартель
,
,
Дециль
|
|
, (от 1/10 до 9/10)
Показатели вариации (колеблемости) признака
Среднее линейное отклонение – на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
-для несгруппированных данных (первичного ряда):
-для вариационного ряда:
Среднееквадратическое отклонение
-для несгруппированных данных:
-для вариационного ряда:
Дисперсия
-для несгруппированных данных:
-для вариационного ряда:
Коэффициент вариации (используется для характеристики однородности совокупности по исследуемому признаку)
- до 17% – совокупность совершенно однородна, 17%-33% - достаточно однородна, >33% - неоднородна.
Сложение дисперсий
Величина общей дисперсии ( ) характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности
, - общая средняя арифметическая для всей совокупности
Межгрупповая дисперсия ( ) отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки
, - средняя в каждой группе, - число единиц в каждой группе
Средняя внутригрупповая дисперсия ( ) характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки.
|
|
, где - дисперсия по отдельной группе
или
Равенство:
Корреляционное отношение
, >0,5 – связь между групповым фактором и результирующим признаком – тесная, <0,5 – связь слабая
Показатель асимметрии
, - центральный момент третьего порядка
Средняя квадратическая ошибка: , n – число наблюдений
Если , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.
- правосторонняя асимметрия, - левосторонняя асимметрия.
Показатель эксцесса (островершинности)
, - центральный момент четвертого порядка
>0 – высоковершинное, < 0 – низковершинное ( = -2 – предел)
Средняя квадратическая ошибка: n – число наблюдений
Кривые распределения
Кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения.
Плотность распределения (расчет теоретических частот)
, - нормированное отклонение
|
|
, - определяется по таблице (приложение 1)
Критерий согласия К. Пирсона (для проверки близости теоретического и эмпирического распределений, для проверки соответствия эмпирического распределения закону нормального распределения)
f – эмпирические частоты в интервале, f’ – теоретические частоты в интервале
Критерий согласия Романовского
, m – число групп, m-3 – число степеней свободы при исчислении частот нормального распределения
Если к<3, то можно принять гипотезу о нормальном характере эмпирического распределения
Критерий Колмогорова
, D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами, n – сумма эмпирических частот
Распределение Пуассона (теоретические частоты)
, n – общее число независимых испытаний, λ – среднее число появления редкого события в n одинаковых независимых испытаниях, m – частота данного события, е=2,71828
Выборочное наблюдение
N – объем генеральной совокупности
n – объем выборочной совокупности (число единиц, попавших в выборку)
- генеральная средняя (среднее значение признака в генеральной совокупности)
- выборочная средняя
р – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности)
w – выборочная доля
- генеральная дисперсия
- выборочная дисперсия
- среднее квадратическое отклонение признака в генеральной совокупности
S – среднееквадратическое отклонение признака в выборочной совокупности.
Неравенство Чебышеба
При неограниченном числе наблюдений, независящих друг от друга из генеральной совокупности с вероятностью сколь угодно близкой к 1, можно утверждать, что расхождение между выборочной и генеральной средней будет сколь угодно малой величиной .
Теорема Ляпунова
Дает количественную оценку ошибки. При неограниченном объеме из генеральной совокупности с Р расхождения выборочной и генеральной средней равна интегралу Лапласа
, - нормированная функция Лапласа (интеграл Лапласа)
Р – гарантированная вероятность
t – коэффициент доверия, зависящий от Р
Р | 0,683 | 0,954 | 0,997 |
t | 1 | 2 | 3 |
- предельная ошибка выборки
, - стандартная среднеквадратическая ошибка
, - предельная (максимально возможная) ошибка средней, t – коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки
, - предельная (максимально возможная) ошибка доли
Средняя ошибка (n>30) при случайной повторной выборке:
,
При случайной бесповторной выборке:
,
Дата добавления: 2018-04-15; просмотров: 339; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!