Эмпирическая функция распределения
Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка, причем значение x1–наблюдалось раз, x2-n2 раз,… xk - nk раз. n = n1+n2+...+nk– объем выборки. Наблюдаемые значения называются вариантами, а последовательность вариант, записанных в возрастающем порядке- вариационным рядом. Числа наблюдений называются частотами (абсолютными частотами), а их отношения к объему выборки - относительными частотами или статистическими вероятностями.
Если количество вариант велико или выборка производится из непрерывной генеральной совокупности, то вариационный ряд составляется не по отдельным точечным значениям, а по интервалам значений генеральной совокупности. Такой вариационный ряд называется интервальным. Длины интервалов при этом должны быть равны.
Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.
Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (суммы частот, попавших в этот интервал значений)
Точечный вариационный ряд частот может быть представлен таблицей:
xi | x1 | x2 | … | xk |
ni | n1 | n2 | … | nk |
Аналогично можно представить точечный вариационный ряд относительных частот.
Пример:
Число букв в некотором тексте Х оказалось равным 1000. Первой встретилась буква «я», второй- буква «и», третьей- буква «а», четвертой- «ю». Затем шли буквы «о», «е», «у», «э», «ы».
|
|
Выпишем места, которые они занимают в алфавите, соответственно имеем: 33, 10, 1, 32, 16, 6, 21, 31, 29.
После упорядочения этих чисел по возрастанию получаем вариационный ряд: 1, 6, 10, 16, 21, 29, 31, 32, 33.
Частоты появления букв в тексте: «а» - 75, «е» -87, «и»- 75, «о»- 110, «у»- 25, «ы»- 8, «э»- 3, «ю»- 7, «я»- 22.
Составим точечный вариационный ряд частот:
Пример:
Задано распределение частот выборки объема n = 20.
Составьте точечный вариационный ряд относительных частот.
xi | 2 | 6 | 12 |
ni | 3 | 10 | 7 |
Решение:
Найдем относительные частоты:
xi | 2 | 6 | 12 |
wi | 0,15 | 0,5 | 0,35 |
При построении интервального распределения существуют правила выбора числа интервалов или величины каждого интервала. Критерием здесь служит оптимальное соотношение: при увеличении числа интервалов улучшается репрезентативность, но увеличивается объем данных и время на их обработку. Разность xmax - xmin между наибольшим и наименьшим значениями вариант называют размахом выборки.
Для подсчета числа интервалов k обычно применяют эмпирическую формулу Стреджесса (подразумевая округление до ближайшего удобного целого): k = 1 + 3.322 lg n.
|
|
Соответственно, величину каждого интервала h можно вычислить по формуле :
Эмпирическая функция распределения
Эмпирической (опытной) функцией распределения или функцией распределения выборки называют такую функцию, которая определяет для каждого значения x частоту событий X<x и предназначена для оценке теоретической функции распределения генеральной совокупности в математической статистике.
Эмпирическая функция распределения находится по формуле:
n — объем выборки;
nx — количество наблюдений (вариантов) меньше x.
Пример
Дана таблица функции распределения выборки. Требуется построить эмпирическую функцию распределения
xi | 1 | 2 | 3 | 4 | 5 | 6 |
ni | 4 | 10 | 6 | 8 | 7 | 5 |
Решение
Из таблицы n=40, т.е.
n=4+10+6+8+7+5=40
Вычислим функцию распределения выборки
Эмпирическая функция распределения имеет вид
Построим график кусочно-постоянной эмпирической функции распределения
таким образом, по данным выборки можно приближенно построить функцию для неизвестной функции выборки.
Дата добавления: 2021-01-20; просмотров: 130; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!