ГЛАВА 3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН И ИХ СТАТИСТИЧЕСКАЯ ОЦЕНКА



Nbsp; Глава 1. МОДЕЛИРОВАНИЕ СИСТЕМ   1. Моделирование и математические модели, компьютерное моделирование Моделирование – замещение исследуемого объекта (оригинала) его условным образцом или другим объектом (моделью) и изучение свойств оригинала путем исследования свойств модели. Математические модели представляют собой формальное описание объектов или систем с помощью некоторого абстрактного языка, например, в виде совокупности математических соотношений или схемы алгоритма. Виды математических моделей: 1) вербальные - словесные, виде текста; 2) графические - в виде схем, диаграмм и графиков; 3) табличные - в виде таблиц; 4) аналитические - в виде формул; 5) алгоритмические - в виде заданной последовательности действий.   Технология компьютерного моделирования предполагает выполнение следующих операций: 1) определение целей моделирования, то есть определение исследователем интересующего объекта и того, что необходимо получить в результате моделирования; 2) разработка концептуальной модели (исследователь должен указать сигналы объекта); 3) формализация модели (необходимо составить математическое описание системы на формальном математическом языке); данный этап называют идентификацией; 4) программная реализация модели (необходимо формализованное математическое описание привести к виду, позволяющему провести моделирование на компьютере); 5) планирование модельных экспериментов (необходимо определить влияние каких параметров на исследуемый объект необходимо уточнить); 6) реализация плана эксперимента (запускается программа, и производиться реализация плана); 7) анализ и интерпретация результатов моделирования.     2. Аппроксимационный подход к построению математической модели   Основная идея данного метода состоит в отказе от аналитического поиска структуры моделей на основе предположения, что неизвестная зависимость (истинная модель объекта) может быть представлена некоторой приближенной формулой. Особенности аппроксимационного подхода: 1) аппроксимационные модели строятся, не используя априорную информацию о структуре системы и взаимодействия между ее элементами; 2) качество моделирования зависит от того, насколько удачно подобрана («указана») аппроксимационная формула; 3) аппроксимационная модель не является универсальной, а пригодна лишь для описания конкретной системы, для которой она строится.   Пример: «Формула Кобба-Дугласа» очень часто встречающаяся в экономике: А=kBaCbDg…, где B, C, D,… - входы модели; А – выход модели; k, a, b, g,… - коэффициенты (const), выбираемые исходя из статистических данных. Более конкретно, определение объема производства с помощью формулы Кобба-Дугласа: Y=C Lb K1-b,  (1) где Y – объем производства; L – труд (количество работы, трудозатраты и т.п.); К – капитал (вложенные средства, инвестиции и т.п.); С – постоянный параметр, называемый коэффициентом эффективности;  b ­­ – постоянный параметр (<1); Предположим нам известен объем производства при некоторых значениях L и К. Тогда можно определить параметры модели (1) С и b. После чего на основе формулы (1) спрогнозировать объем производства Y для произвольно заданных L и K.     3. Регрессионные модели   Регрессионные модели относятся к классу аппроксимационных, и являются наиболее распространенными в эконометрике.   Предположим, имеется набор входных и соответствующий им выходных данных какого-либо объекта                                        <  (i), y(i)>, i=1, 2,... N.          (1)   Номера экспериментальных точек указываются в скобках (i) чтобы не перепутать их с номерами компонент вектора.     При этом подходе аппроксимационная формула выбирается в виде:   ,           (2)   где g(.) – функция регрессии с параметрами b1,b2,…,bL.     В частном случае рассматривается так называемая модель линейная по параметрам , (3) то   -  базисные функции;   или в векторной форме: ,                          (4) где , .   Частный случай - линейная регрессия:    (5)   В формуле (4) вектор базисных функций для линейной регрессии имеет вид:   ,   Задача оценки параметров модели формулируется следующим образом: Пусть есть совокупность экспериментальных точек (1): , . Необходимо найти коэффициенты b1,b2,…,bL или вектор .   Решение будем искать методом наименьших квадратов (МНК). Оно должно удовлетворять следующим свойствам: .   (6)   Необходимо найти такой вектор параметров , которой минимизирует сумму квадратов отклонений аппроксимирующей функции от экспериментальных данных. Для модели линейной по параметрам оптимизационная задача (6) может быть решена в аналитическом виде, т.е. в виде формулы для расчета параметров . Введем в рассмотрение матрицу базисных функций в экспериментальных точках:   ,     тогда параметры по методу наименьших квадратов определяются следующим образом:    , (7)   где  - вектор значений y в экспериментальных точках.   Рассмотрим примеры.   Пример 1. Линейная модель     В формуле (4) вектор базисных функций для линейной регрессии имеет вид:       Матрица   В скобках указаны номера обучающих точек.   Пример 2.   Аппроксимирующая зависимость - квадратичный полином второго порядка от одной переменной.   Вектор базисных функций имеет вид:     А матрица       Пример 3. Аппроксимация полиномом n-го порядка от от m переменных.   Вектор базисных функций имеет вид:   , где n – порядок модели; m - размерность модели (входного вектора)   Можно показать, что общее количество базисных функций определяется формулой:   .     Если рассмотреть порядок n=2, т.е. квадратичную модель, то можно получить следующие соотношения:   m L 1 3 2 6 4 15 5 21 10 66     4. Особенности вычислений с использованием формулы   Операции: транспонирование, умножение и обращение матриц. В MS Excel функции: "Ссылки и массивы" - ТРАНСП, "Математические" - МУМНОЖ, МОБР   LibreOffice Calc "Массив" - TRANSPOSE, MMULT, MINVERSE     5. Сведение нелинейной регрессии к линейной   В ряде случаев нелинейную регрессию удается свести к линейной.   Вернемся к формуле Кобба-Дугласа   А=kBaCbDg…, где B, C, D,… - входы модели; А – выход модели; k, a, b, g,… - коэффициенты (const), выбираемые исходя из статистических данных.   Есть некоторая таблица значений входных факторов и выхода модели и по ним необходимо определить параметры. Пролагарифмируем формулу слева и справа . Введем замену переменных ,  и т.д. (8)   Тогда формула Кобба-Дугласа в преобразованных переменных будет иметь вид:  (9) - линейная функция. Таким образом, пересчитав входные и выходные переменные в соответствии с формулой (8) можно вычислить параметры модели (9), а по ним определить параметры исходной формулы Кобба-Дугласа. Метод является приближенным, так как в данном случае критерий оптимизации не рак раньше       ГЛАВА 2. ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.

ПОСТРОЕНИЕ ГИСТОГРАММЫ

1. Понятие вероятности

Рассматривается опыт, в результате которого может произойти событие А (исход опыта), произойдет или не произойдет указанное событие в действительности заранее достоверно неизвестно.

Примеры подобного опыта:

1. Бросание монеты, событие А – выпадение орла (герба).

2. Изделие находится в работе, событие А – изделие выйдет из строя на заданном интервале времени.

3. На удачу выбирается день в календаре, событие А – выбранный день оказался воскресеньем.

В теории вероятностей каждому элементарному событию А ставится в соответствие числовая мера возможности его наступления ­ – вероятность события А. Обозначается: Р(А).

Вся теория вероятности базируется на предположении о постоянстве вероятностей, т.е. стационарности рассматриваемых систем на заданном временном интервале и в заданных условиях.

Классическое определение вероятности. Данное определение вероятности основано на симметрии множества возможных исходов опыта.

Предположим, что у опыта имеется N равновозможных исходов, при этом из них m соответствуют наступлению события А, тогда вероятность события А равна отношению m/N, т.е.

P(A)=m/N.

Рассмотрим примеры:

1. Бросание монеты, событие А – выпадение орла (герба). Всего равновозможных исходов два, т.е. N=2 – выпадение орла (герба) и выпадение решки (цифры). Выпадению герба из двух данных исходов соответствует лишь один исход, т.е. m=1. Таким образом, вероятность выпадения герба Р=1/2.

2. Бросание игрального кубика, имеющего 6 граней. Вероятность выпадения цифры 1 – P=1/6. Вероятность выпадения четной цифры P=1/2, так как из 6 равновозможных исходов (N=6) выпадению четной цифры соответствуют три: 2, 4, 6, т.е. m=3. P=3/6=1/2.

 

2. Случайные величины и их описание

 Величина, которая в результате опыта может принимать различные значения в зависимости от случая называется случайной величиной (сокращенно СВ). Другое название случайных величин – случайные числа (СЧ).

Законом распределения случайной величины называется соответствие между возможными значениями СВ и вероятностями их наступления.

Случайная величина X является дискретной, если она может принимать одно из значений на конечном или бесконечном дискретном множестве x1, x2, x3,...

Одним из возможных вариантов представления закона распределения дискретной СВ является ряд распределения – таблица, в которой для возможных значений перечислены соответствующие им вероятности:

 

X1 X2 X3 X4 .... XN
P1 P2 P3 P4   PN

 

Так как случайная величина обязательно принимает одно из перечисленных значений, то сумма вероятностей ряда распределения равна 1 т.е. .

Непрерывная случайная величина – СВ возможные значения которой непрерывно заполняют некоторую область.

Примеры непрерывной СВ: температура воздуха, рост наугад выбранного человека, скорость автомобиля и т.п.

Очевидно, что для непрерывной СВ невозможно построить ряд распределения, так как число возможных значений бесконечно.

Наиболее универсальной формой закона распределения является функция распределения, называемая так же интегральный закон распределения.

Функция распределения численно равна вероятности того, что случайная величина примет значение меньше x, что можно записать формулой:

.

F(x) – неубывающая функция, так как с ростом x вероятность того, что X примет значение меньшее, чем x не может возрастать.

Несложно также понять, что  и .

Вероятность попадания случайной величины на заданный интервал (a, b) определяется формулой:

.

Плотность распределения или дифференциальный закон распределения случайной величины определяется формулой:

.

Вероятность попадания случайной величины в заданный интервал:

,

S – это площадь заштрихованной области на рисунке.

 

3. Построение функции распределения и плотности распределения на основе экспериментальных данных

 

Построенная (восстановленная) на основе экспериментальных данных плотность распределения в статистике называется гистограммой.

Предположим, что в нашем распоряжении имеются результаты наблюдений над непрерывной случайной величиной . Разделим весь диапазон наблюденных значений на интервалы и подсчитаем количество значений , приходящееся на каждый -й разряд. Это число разделим на общее число наблюдений и найдем частоту, соответствующую данному интервалу:

.  

Сумма частот всех интервалов, очевидно, должна быть равна единице.

Построим таблицу, в которой приведены интервалы в порядке их расположения вдоль оси абсцисс и соответствующие частоты. Эта таблица называется статистическим рядом:

 

Здесь — обозначение -го интервала, - его границы; - соответствующая частота; - число интервалов.

Гистограмма строится следующим образом. По оси абсцисс откладываются интервалы, и на каждом из интервалов строится прямоугольник, площадь которого равна частоте данного разряда. Для построения гистограммы нужно частоту каждого разряда разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине разрядов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная площадь ее равна единице.

 

 

Пользуясь данными статистического ряда, можно приближенно построить и статистическую функцию распределения величины .

В качестве этих точек удобно взять границы разрядов, которые фигурируют в статистическом ряде. Тогда, очевидно,

 

 

ГЛАВА 3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН И ИХ СТАТИСТИЧЕСКАЯ ОЦЕНКА

1. Числовые характеристики случайных величин

Числовые характеристики случайных величин позволяют описывать распределение СВ одним параметром, что удобно при практическом применении.

1. Характеристики центра распределения

Математи́ческое ожида́ние – среднее значение случайной величины.

  • Если X {\displaystyle X} — дискретная случайная величина, имеющая распределение

P ( X = x i ) = p i , ∑ i = 1 ∞ p i = 1 {\displaystyle \mathbb {P} (X=x_{i})=p_{i},\;\sum \limits _{i=1}^{\infty }p_{i}=1}

то её математическое ожидание:

M [ X ] = ∑ i = 1 ∞ x i p i {\displaystyle M[X]=\sum \limits _{i=1}^{\infty }x_{i}\,p_{i}}

  • Если F X ( x ) {\displaystyle F_{X}(x)} — функция распределения случайной величины, то её математическое ожидание задаётся интегралом:

2. Характеристики рассеянья случайной величины

Диспе́рсия случа́йной величины́ – мера разброса случайной величины, численно равная математическому ожидаю квадрата отклонения СВ от ее математического ожидания.

Пусть  – случайная величина, тогда дисперсией называется

.

· Если случайная величина X {\displaystyle X} дискретная, то

D [ X ] = ∑ i = 1 n p i ( x i − M [ X ] ) 2 {\displaystyle D[X]=\sum _{i=1}^{n}{p_{i}(x_{i}-M[X])^{2}}}

· Если случайная величина X {\displaystyle X} непрерывна, то:

D [ X ] = ∫ − ∞ ∞ f ( x ) ( x − M [ X ] ) 2 d x {\displaystyle D[X]=\int _{-\infty }^{\infty }{f(x)(x-M[X])^{2}dx}}

Среднеквадратическое отклонение (стандартное отклонение, СКО) равно квадратному корню из дисперсии СВ:

.

Достоинство СКО – оно измеряется в единицах измерения самой случайной величины, а не ее квадрата, как дисперсия.

3. Характеристики связи случайных величин

Важной характеристикой совместного распределения двух случайных величин является ковариация (или корреляционный момент). Ковариация определяется как математическое ожидание произведения отклонений случайных величин:

.

Основное свойство ковариации: ковариация двух независимых случайных величин X и Y равна нулю.

Линейный коэффициент корреляции (или коэффициент корреляции Пирсона). Коэффициент корреляции рассчитывается по формуле:

.

Свойства коэффициента корреляции:

1. Коэффициент корреляции изменяется в пределах от -1 до +1.

2. Коэффициент корреляции двух независимых СВ – 0.

3. Если две величины жестко линейно связаны, то их коэффициент корреляции -1 или +1.

 

2. Оценка числовых характеристик случайных величин на основе

экспериментальных данных

 

Пусть x i {\displaystyle x_{i}} i-й элемент выборки; n {\displaystyle n} – объём выборки.

Оценка математического ожидания - среднее значение:

Оценка дисперсии:

Оценка среднеквадратического отклонения:

Оценка коэффициента корреляции:

 

Статистические функции в Excel:

Среднее значение: =СРЗНАЧ(диапазон)

Дисперсия: =ДИСП(диапазон)

Среднеквадратическое отклонение: =СТАНДОТКЛОН(диапазон)

Коэффициент корреляции: =КОРРЕЛ(диапазон 1; диапазон 2)

Нормальное распределениеявляется наиболее распространенным на практике.

 


Дата добавления: 2018-04-05; просмотров: 443; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!