Технология работы при формировании выборки



Достаточно сложной проблемой является определение необходимого (оптимального) объема выборки. В математической статистике доказывается, что необходимая численность собственно-случайной повторной выборки определяется выражением:

–предельная ошибка выборки; σ2– дисперсия генеральной совокупности; t – коэффициент доверия (определяется в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты выборочного обследования).

Затруднительным моментом применения приведенной формулы на практике является расчет генеральной дисперсии σ2 . Для ее оценки пользуются или материалами предыдущих исследований, или производственно-техническими нормативами, или, если предыдущие варианты неосуществимы, проводят пробное обследование. По результатам пробного обследования оценивают значение генеральной дисперсии для последующего обоснования необходимого объема выборки. Дисперсию можно определить приближённо , исходя из предположения, что рассматриваемая величина подчиняются нормальному закону распределения/

Примечание: В расчете необходимого объема выборки используется коэффициент доверия t, для вычисления которого в Microsoft Excel предусмотрена функция СТЬЮДРАСПОБР. Коэффициент доверия t рассчитывается по формуле =СТЬЮДРАСПОБР(0,05;n-1), где 0,05 = 1-0,95 - уровень значимости (по умолчанию - 0,95), n-1 число степеней свободы.

 Дисперсию можно определить  приближённо , исходя из предположения, что рассматриваемая величина подчиняются нормальному закону распределения.

1. Выбирается режим «Выборка»

2. В диалоговом окне данного режима (рис.11) задаются следующие параметры:

· Входной интервал см. подраздел 1.2

· Число выборок (объем выборки).

· Выходной интервал.(рис. 12 а)

3. После нажатия кнопки ОК в выходном интервале появляется полученная выборка (рис 12б.)

Рис. 11.

Рис.12 а Рис.12 б

 

Характеристика статистической совокупности. Средние     величины. Меры рассеяния

 

Статистическая информация представляется совокупностью данных, для характеристики которых используются разнообразные показатели, называемые показателями описательной статистики.

Показатели описательной статистики можно разбить на несколько групп:

1. Показатели положения описывают положение данных на числовой оси. Примеры таких показателей - минимальный и максимальный элементы выборки (первый и последний члены вариационного ряда), верхний и нижний квартили (ограничивают зону, в которую попадают 50% центральных элементов выборки). Наконец, сведения о середине совокупности могут дать средняя арифметическая, средняя гармоническая, медиана и другие характеристики.

2. Показатели разброса описывают степень разброса данных относительно своего центра. К ним в первую очередь относятся: дисперсия, стандартное отклонение, размах выборки (разность между максимальным и минимальным элементами), межквартильный размах (разность между верхней и нижней квартилью), эксцесс и т. п. Эти показатели определяют, насколько кучно основная масса данных группируется около центра.

3. Показатели асимметрии характеризуют симметрию распределения данных около своего центра. К ним можно отнести коэффициент асимметрии, положение медианы относительно среднего и т. п.

4. Показатели, описывающие закон распределения, дают представление о законе распределения данных. Сюда относятся таблицы частот, таблицы частостей, полигоны, кумуляты, гистограммы

На практике чаще всего используются следующие показатели: средняя арифметическая, медиана, дисперсия, стандартное отклонение. Однако для получения более точных и достоверных выводов необходимо учитывать и другие из перечисленных выше характеристик, а также обращать внимание на условия получения выборочных совокупностей. Наличие выбросов, т. е. грубых ошибочных наблюдений, может не только сильно исказить значения выборочных показателей (выборочного среднего, дисперсии, стандартного отклонения и т. д.), но и привести ко многим другим ошибочным выводам.

Наиболее распространенной формой статистических показателей, используемой в социально – экономических явлениях, является средняя величина, представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени.

Сущность средней состоит в том, что в ней взаимопогащаются отклонения значений признака у отдельных единиц совокупности, обусловленные действием случайных факторов. Наиболее распространенным видом средних величин является средняя арифметическая.

Средняя арифметическая взвешенная. Зависимость для определения средней арифметической взвешенной для дискретного вариационного ряда имеет вид:

, где ni – частота i-го признака

Наряду со средней арифметической, в статистике применяются такие виды средние, как медиана и мода.

Медиана (обозначаемая буквами Ме) — это серединная, центральная варианта, делящая вариационный ряд пополам, на две равные части.

Мода (обозначаемая Мо) — чаще всего встречающаяся или наиболее часто повторяющаяся величина, соответствующая при графическом изображении максимальной ординате, т. е. наивысшей точке графической кривой. Таким образом, при приближенном нахождении моды в простом (несгруппированном) ряду она определяется как наиболее насыщенная или частая величина, как варианта с наибольшим количеством частот.

Средняя арифметическая (М) является результативной суммой всех влияний. В ее формировании принимают участие все без исключения варианты, в том числе и крайние варианты. Медиана и мода, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений, т. е. всех членов вариационного ряда, а обусловливаются относительным расположением или распределением вариант. Поэтому медиану и моду также называют описательными или позиционными средними, т. к. они характеризуют главнейшие свойства данного распределения. М характеризует всю массу наблюдений, а Ме и Мо — основную массу, без учета воздействия крайних вариант, т. е. исключая крайние значения, зависящие иногда от случайных причин.

Средние арифметические величины, взятые сами по себе без дополнительных приемов оценки, имеют подчас ограниченное значение, т. к. они не отражают степени разброса (или рассеяния) ряда. Одинаковые по размеру средние могут быть получены из рядов с различной степенью рассеяния. Средние — это величины, вокруг которых рассеяны различные варианты. Понятно, что чем ближе друг к другу отдельные варианты, тем типичнее его средняя.

Меры разброса (рассеяния). Средние арифметические величины, взятые сами по себе без дополнительных приемов оценки, имеют ограниченное значение, т. к. они не отражают степени разброса (или рассеяния) ряда.

Одинаковые по размеру средние могут быть получены из рядов с различной степенью рассеяния. Существует ряд показателей, с помощью которых как раз и оценивается мера разброса или рассеяния ряда.

Размах – разность между наибольшими и наименьшими значениями в ряде или распределении. Размах учитывает только экстремальные значения и поэтому не дает информации о разбросе отдельных элементов

Дисперсия – средний квадрат отклонения значений от их арифметического среднего

Среднеквадратичное отклонение – положительный корень из дисперсии. Это показатель разброса данных около арифметического среднего

Коэффициент вариации – это среднеквадратичное отклонение, деленное на арифметическое среднее, выраженное в процентах.


Дата добавления: 2019-01-14; просмотров: 170; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!