Основы теории вероятностей и математической статистики

1.Случайное событие – это событие, которое при данных условиях может произойти, либо не произойти. Относительная частота событий называется вероятностью и показывает отношение числа ожидаемых событий к числу возможных. Статистическое определение вероятности подразумевает под собой вероятность как предел, к которому стремится относительная частота. При классическом определении отн. частота и вероятность совпадают. В этом случае должно быть известно должны быть известны полное число возможных событий и число ожидаемых событий (орёл-решка, кубики и тп). Совместные события могут происходить параллельно друг другу; несовместные события исключают появление друг друга в ходе проводимого опыта. Зависимым называется событие, на вероятность которого оказывает влияние исход какого-либо иного события. Независимые наоборот.

2.Теорема сложение вероятностей: вероятность появление какого-либо события из нескольких несовместных равна сумме их вероятностей (или то, или другое) Теорема умножения вероятностей: Вероятность совместного появления независимых событий равна произведению их вероятностей(и то и другое). Условная вероятность — вероятность одного события при условии, что другое событие уже произошло(опыт с шариками в мешке, которые вытаскивают и не возвращают)

3.Соотношение между возможными значениями случайной величины и их вероятностями называется законом распределения дискретной случайной величины(возможные значения которой образуют конечную или бесконечную последовательность чисел). Закон распределения может быть задан аналитически, в виде таблицы или графически. Математическое ожидание имеет смысл среднего значения случайной величины. Для дискретных случ. величин оно определяется как сумма произведений случ. величины на вероятность её появления. Дисперсия описывает разброс случ. величин относительно математического ожидания. Дисперсия дискретных случ. величин определяется, как сумма квадратов разности случ. величин и математического ожидания на соответствующие вероятности появления этих случайных величин. Среднее квадратичное отклонение — это квадратный корень из среднего арифметического всех квадратов разностей между данными величинами и их средним арифметическим.

4. Непрерывные случайные величины всегда имеют вероятность равную нулю, поскольку количество её возможных численных значений бесконечно велико. Математическое ожидание имеет смысл среднего значения случайной величины. Для дискретных случ. величин оно определяется как сумма произведений случ. величины на вероятность её появления. Дисперсия описывает разброс случ. величин относительно математического ожидания. Дисперсия дискретных случ. величин определяется, как сумма квадратов разности случ. величин и математического ожидания на соответствующие вероятности появления этих случайных величин. Среднее квадратичное отклонение — это квадратный корень из среднего арифметического всех квадратов разностей между данными величинами и их средним арифметическим.

5. Случайная величина называется дискретной случайной величиной, если она принимает не более чем счетное число значений. Примеры:

1) дискретная случайная величина Бернулли(закон распределения Бернулли). Закон распределения дискретной случайной величины Бернулли имеет следующий вид: 0<p<1

Такому распределению соответствует бросание монеты, на одной стороне которой - 0, а на второй - 1.

2) дискретная биномиальная случайная величина (биномиальное распределение). Закон распределения данной дискретной случайной величины запишется следующим образом:

где

Число успехов в n испытаниях схемы Бернулли имеет биномиальное распределение.

3) дискретная случайная величина Пуассона(пуассоновское распределение с параметром). Закон распределения дискретной случайной величины Пуассона задается следующим образом:

где - параметр.

Закон распределения случайной величины Пуассона носит название закона редких событий, например, число вызовов, поступивших на телефонную станцию, число распавшихся нестабильных частиц и т.д.

4) дискретная геометрическая случайная величина (геометрическое распределение). Закон распределения геометрической дискретной случайной величины имеет вид

Пусть производятся независимые испытания, причем в каждом испытании возможны два исхода - "успех" с вероятностью p или "неуспех" с вероятностью 1 - p, 0 < p < 1. Обозначим через число испытаний до первого появления "успеха", тогда будет дискретной геометрической случайной величиной.

Распределение случайной величины называется непрерывным, а сама случайная величина - непрерывной случайной величиной, если для любого

где - интегрируемая по Лебегу функция. Функция называется плотностью распределения случайной величины.

Примеры

1) нормальная непрерывная случайная величина, или непрерывная случайная величина Гаусса(нормальное распределение).Важная роль этого распределения объясняется тем, что оно обычно возникает в явлениях, подверженных действию большого числа малых случайных величин. Так, математическая теория выборочного метода в статистике для расчета некоторых показателей широко использует нормальное распределение.

2)экспоненциальная (показательная) непрерывная случайная величина(экспоненциальное распределение).Экспоненциальному распределению подчиняется время распада ядер атомов различных элементов. Оно обладает важным свойством - отсутствием последствия. Несложно убедиться в том, что вероятность распада ядра за время при условии, что перед этим оно уже прожило время, совпадает с безусловной вероятностью распада того же самого ядра за время. Именно это свойство и представляет собой отсутствие последствия.

3) Равномерная на [a;b] непрерывная случайная величина(равномерное на отрезке [a;b] распределение).Равномерное распределение реализует принцип геометрической вероятности при бросании точки на отрезок [a;b].

Закон Бернулли: число ожидаемых событий, появляющихся в опытах с n независимыми испытаниями, в которых ожидаемые события характеризуются одинаковой вероятностью p или:

Математическое ожидание

Пусть — случайная величина, определённая на некотором вероятностном пространстве. Тогда где символ M обозначает математическое ожидание.

6. смотри билет 5

Закон распределения Пуассона: удовлетворяет вероятности появления заданного количества редко происходящих случайных событий, наблюдаемых в серии из большого количества независимых повторных опытов. Вероятность намного меньше 1.

Где m-число ожидаемых событий, а- параметр распределения, совпадающий с математическим ожиданием, е-основание натурального логарифма. Распределению Пуассона удовлетворяют числа редких событий, происходящих за определённый промежуток времени.

7. Непрерывные и дискретные случайные величины. Плотность вероятности. Нормальный закон распределения. Математическое ожидание и дисперсия. Графическое представление. Примеры.

Дискретные случайные величины – величины, которые могут принимать счетное количество значений конечное или бесконечное.
пример: количество пассажиров в транспорте.

Непрерывные случайные величины- величины. Которые принимают бесконечное число возможных значений в конечном, или в бесконечном интервалах изменения
пример: время, масса, объем, температура тела.

Плотностью вероятности f(x) непрерывной случайной величины Х называется производная функции распределения F(X) этой величины: f(x)=F’(X)

Основные свойства плотности:
1). Плотность вероятности является неотрицательной функцией: f(x)>0
2) вероятность того, что в результате испытания непрерыв. Случ. Величина примет какое-либо значение из интервала(а,b), равна определенному интегралу(в пределах от а до b) от плотности вероятности этой случайной величины.

3).определенный интеграл в пределах от минус бесконечности до плюс бесконечности от плоности вероятности непрерывной случайной величины равен единице..

4)определенный интеграл в пределах от «–«бесконечности до х от плотности вероятности непрерывной случайной величины равен функции распределения этой величины.

Нормальное распределение, также называемое распределением Гаусса — распределение вероятностей, которое задается функцией плотности распределения:

где параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ ² — дисперсия.

Графики нормального распределения

Математическим ожиданием дискретной случайной величины называется сумма парных произведений всех возможных значений случайной величины на соответствующие им вероятности, т.е. * Диспе́рсия случа́йной величины́ — мера разброса данной случайной величины, то есть её отклонения от математического ожидания. Пусть — случайная величина, определённая на некотором вероятностном пространстве. Тогда где символ M обозначает математическое ожидание.

 

8. Стандартное нормальное распределение. Стандартные интервалы. Понятия доверительного интервала и доверительной вероятности.

Доверительный интервал — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью.

Пусть - выборка из некоторого распределения с плотностью , зависящей от параметра , который может изменяться в интервале . Пусть - некоторая статистика и - функция распределения случайной величины , когда выборка имеет распределение с плотностью . Предположим, что есть убывающая функция от параметра . Обозначим квантиль распределения , тогда есть возрастающая функция от . Зафиксируем близкое к нулю положительное число (например, 0,05 или 0,01). Пусть . При каждом неравенства

(1)

выполняются с вероятностью , близкой к единице. Перепишем неравенства (1) в другом виде:

(2)

Обозначим , и запишем (2) в следующем виде:

Интервал называется доверительным интервалом для параметра , а вероятность - доверительной вероятностью.

Нормальное распределение, также называемое распределением Гаусса — распределение вероятностей, которое задается функцией плотности распределения:

где параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ ² — дисперсия.

Графики нормального распределения

 

 

9. Понятие генеральной совокупности и выборки. Объём выборки, репрезентативность. Статистическое распределение (вариационный ряд). Примеры. Характеристики выборки

Генеральной совокупностью называют множество каких либо однородных элементов, из которого по определенному правилу выделяется некоторая часть элементов. Называемая выборкой. Число таких выделяемых объектов называется объемом выборки. Выборка производится с целью описания генеральной совокупности. Если это описание является полным и корректным, то выборка называется репрезентативной.

Пример.при анализе забол-ти детей, определенной возрастной группы, ген.совокупностью являются данные осмотра всех детей данной возрастной группы, а выборкой являютя данные, полученные в пределах одного района.

Варианта – конкретное значение случайной величины

Вариац.ряд-варианты в определенном порядке. Вариационным (статистическим) рядом называется таблица, первая строка которой содержит в порядке возрастания элементы ', а вторая - их частоты (относительные частоты .

10. Оценка параметров генеральной совокупности по характеристикам её выборки (точечная и интервальная). (Параметры генеральной совокупности и характеристики выборки. Формулы, пояснения).

Интервальные оценки

По известной величине выборочной характеристики ( или и др.) можно определить интервал, в котором с той или иной вероятностью определяется значение параметра генеральной совокупности, оцениваемого по этой выборочной характеристике.

Вероятности, признанные достаточными для того, чтобы уверенно судить о генеральных параметрах на основании выборочных характеристик, называются доверительными.

Обычно в качестве доверительных вероятностей выбирают значения 0,95, 0,99 или 0,999 (их принято выражать в процентах). Перечисленным значениям соответствуют 95, 99 и 99,9.


5.3. Точечные оценки.

Под термином “оценка” в теории оценок понимаются как сами значения параметров генеральной совокупности, полученные по выборке, так и процесс получения этих значений, т. е. правило, по которому они получены.

Оценки подразделяются на два класса; точечные и интервальные.

Точечные оценки представляют собой определенные значения параметров генеральной совокупности, полученные по выборочным данным. Эти значения должны быть максимально близки к значениям соответствующих параметров генеральной совокупности, которые являются истинными значениями оцениваемых параметров.

ряд требований:

1. Состоятельность. Точечная оценка aВ называется состоятельной, если при неограниченном увеличении объема выборки ( ) она стремится к истинному значению параметра a.

 

2. Несмещенность. Оценка aВ называется несмещенной, если она не содержит систематической ошибки, т. е. среднее значение оценки, определенное по многократно повторенной выборке объема n из одной и той же генеральной совокупности, стремится к истинному значению соответствующего генерального параметра a.

3. Эффективность. Несмещенная оценка является эффективной, если она имеет наименьшую дисперсию по сравнению с другими несмещенными оценками того же параметра генеральной совокупности.

Параметры генеральной совокупности: дисперсия и матем. Ожидание.

 

11. Графические характеристики случайных величин. Гистограмма. Характеристики положения (мода, медиана, выборочная средняя).

Медиа́на (50-й процентиль, квантиль 0,5) — возможное значение признака, которое делит ранжированную совокупность (вариационный ряд выборки) на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана.

Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки . Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им частоты и соединяют точки отрезками прямых.

Полигон относительных частот строится аналогично, за исключением того, что на оси ординат откладываются относительные частоты .

В случае непрерывного признака строится гистограмма, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала – сумму частот вариант, попавших в i–й интервал.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которой служат частичные интервалы длиною h, а высоты равны отношению . Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии (высоте) . Площадь i–го прямоугольника равна – сумме частот вариант i–о интервала, поэтому площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. Условимся обозначать моду буквой . На рис. 5.6.1 и 5.6.2 показана мода соответственно для прерывной и непрерывной случайных величин.

Рис. 5.6.1

 

 

В качестве точечной оценки для “a” берут выборочную среднюю .

Def: выборочной средней называется среднее арифметическое выборки.

(2)

Теорема: выборочная средняя является состоятельной и несмещенной оценкой математического ожидания .

 


Дата добавления: 2015-12-17; просмотров: 14; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!