Эмпирическая функция распределения

Статистическое распределение выборки

Пусть из генеральной совокупности извлечена выборка, причем значение x₁–наблюдалось раз, x₂-n₂ раз,… x_k - n_k раз. n = n₁+n₂+...+n_k– объем выборки. Наблюдаемые значения называются вариантами, а последовательность вариант, записанных в возрастающем порядке- вариационным рядом. Числа наблюдений называются частотами (абсолютными частотами), а их отношения к объему выборки - относительными частотами или статистическими вероятностями.

Если количество вариант велико или выборка производится из непрерывной генеральной совокупности, то вариационный ряд составляется не по отдельным точечным значениям, а по интервалам значений генеральной совокупности. Такой вариационный ряд называется интервальным. Длины интервалов при этом должны быть равны.

Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (суммы частот, попавших в этот интервал значений)

Точечный вариационный ряд частот может быть представлен таблицей:

x_i	x₁	x₂	…	x_k
n_i	n₁	n₂	…	n_k

Аналогично можно представить точечный вариационный ряд относительных частот.

Пример:

Число букв в некотором тексте Х оказалось равным 1000. Первой встретилась буква «я», второй- буква «и», третьей- буква «а», четвертой- «ю». Затем шли буквы «о», «е», «у», «э», «ы».

Выпишем места, которые они занимают в алфавите, соответственно имеем: 33, 10, 1, 32, 16, 6, 21, 31, 29.

После упорядочения этих чисел по возрастанию получаем вариационный ряд: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Частоты появления букв в тексте: «а» - 75, «е» -87, «и»- 75, «о»- 110, «у»- 25, «ы»- 8, «э»- 3, «ю»- 7, «я»- 22.

Составим точечный вариационный ряд частот:

Пример:

Задано распределение частот выборки объема n = 20.

Составьте точечный вариационный ряд относительных частот.

x_i	2	6	12
n_i	3	10	7

Решение:

Найдем относительные частоты:

x_i	2	6	12
w_i	0,15	0,5	0,35

При построении интервального распределения существуют правила выбора числа интервалов или величины каждого интервала. Критерием здесь служит оптимальное соотношение: при увеличении числа интервалов улучшается репрезентативность, но увеличивается объем данных и время на их обработку. Разность x_max - x_min между наибольшим и наименьшим значениями вариант называют размахом выборки.

Для подсчета числа интервалов k обычно применяют эмпирическую формулу Стреджесса (подразумевая округление до ближайшего удобного целого): k = 1 + 3.322 lg n.

Соответственно, величину каждого интервала h можно вычислить по формуле :

Эмпирическая функция распределения

Эмпирической (опытной) функцией распределения или функцией распределения выборки называют такую функцию, которая определяет для каждого значения x частоту событий X<x и предназначена для оценке теоретической функции распределения генеральной совокупности в математической статистике.

Эмпирическая функция распределения находится по формуле:

n — объем выборки;

n_x — количество наблюдений (вариантов) меньше x.

Пример

Дана таблица функции распределения выборки. Требуется построить эмпирическую функцию распределения

x_i	1	2	3	4	5	6
n_i	4	10	6	8	7	5

Решение

Из таблицы n=40, т.е.
n=4+10+6+8+7+5=40
Вычислим функцию распределения выборки

Эмпирическая функция распределения имеет вид

Построим график кусочно-постоянной эмпирической функции распределения

таким образом, по данным выборки можно приближенно построить функцию для неизвестной функции выборки.

Дата добавления: 2021-01-20; просмотров: 130; Мы поможем в написании вашей работы!

Поделиться с друзьями:

Мы поможем в написании ваших работ!