Условные знаки распределения составляющих X,Y непрерывной двумерной СВ.Условные плотности распределения вероятностей



Условной плотностью фи(x/y) распределения составляющих X при данном значении Y=y называют отношение плотности совметного распределения f(x,y) системы (X,Y) к плотности распределения f2(y) составляющей Y: фи(x/y) = f(x,y)/f2(y). Подчеркнём, что отличие условной плотности фи(x/y) состоит в том,чтофун-ия фи(x/y) даёт распределение X при условии,что составляющая Y приняла значение Y=y,фун-ия же f1(x) дает распределение X независимо от того,какие из возможных значений приняла составляющая Y.

Аналогично определяется условная плотность составляющей Y при данном значении X-x :

фи (y/x) = f(x,y)/f1(x).

Если известна плотность совместного распределения f(x,y),то условные плотности составляющих могут быть найдены по формулам:

Фи(x/y) = f(x,y)/∫ f(x,y)dx, фи(y/x) = f(x,y)/∫f(x,y)dy

Отсюда заключаем: умножая закон распределения одной из составляющих на условный закон распределения другой составляющей,найдемзакон распределения системы СВ.

Условное мат. ожидание составляющих X и Y двумерной СВ ,Ф-ии регрессии

Условным мат.ожиданием двумерной случ.величиныYпри X =х (х-определенное возможное знач.Х) наз-т произведение возможных значений Y на их условные вероятности : M(Y/X=x) = ∑mi=1 yp(y/x). Для непрерывных величин :M(Y/X = x) = ∫ y фи(y/x)dy , где фи(y/x) – условная плотность СВ Y при X= x.

Условное мат.ожиданиеM(Y/x) есть фун-ия от х : M(Y/x) = f(x),которую называют фун-ейрегрессии Y на X ..

Аналогично определяется условное мат.ожидание СВ Х и фун-ия регрессии Х на Y :

M(X/y)=фи(y).                     

 

Зависимые и независимые СВ.Корреляционный момент.Коэффициент корреляции

                   Мы называли две величины СВнезависимыми,если закон распределения одной из них не зависит от того,какие возможные значения приняла другая величина

Теорема:Для того чтобы СВ XY были независимыми,необходимо и достаточно,чтобы функция распределения системы (X,Y) была равна произведению функций распределения составлюющих: F(x,y)=F1(X) F2(Y). Док-во: Пусть XYнезависимы.Тогда события Х<x и Y<yнезависимы,следовательно,вероятность совмещения этих равна произведению их вероятностей: P(X<x,Y<y) = P(X<x) P (Y<y) , т.е вероятность совмещения событий Х<xY<y равна произведению вероятностей этих событий.Следоваельно,СВXY независимы

Следствие. Для того чтобы непрерывные СВXY были независимы,необходимо и достаточно,чтобы плотность совместного распределения системы (X,Y) была равна произведению плотностей распределения составляющих : f(x,y)=f1(x)f2(y)

Корреляционный момент служит для хар-ки связи м/у величинами X,Y .Корреляционный момент равен нули,еслиX,Y независимы, следовательно,если корреляционный момент не равен нули,тоX,Y – зависимые СВ

Теорема1. Корреляционный момент двух неизвестных СВX,Y равен нули

Коэффициент корреляции rxyСВX,Yназ-т отношение корреляционного момента к произведению средних квадратических отклонений этих величин

Торема2. Абсолютная величина корреляционного момента двух СВX,Y не превышает среднего геометрического их дисперсий

Теорема3 .Абсолютная величина коэффициенты корреляции не превышает единицы

 

Коррелированность и зависимость составляющих X,Y двумерной СВX,Y

Две СВX,Yназ-т коррелированными,если их корреляционный момент (или,что то же ,коэффициент корреляции) отличен от нуля,X,Yназ-т некоррелированными величинами,если их корреляционный момент равен нулю

Две коррелированные величины также и зависимы.Действительно,допустимпротивное,мы должны заключит,что µxy = 0, а это противоречит условию,так как для коррелированных величин µxy не равно 0.Обратное прелположение не всегда имеет место,т.е. если две величины зависимы,то они могут быть как коррелированными,так и некоррелированными. Другими словами ,коррелированный момент двух зависимых величин может быть не равен нулю,но может и равняться нулю.

 

 

41. Лин.регресссияПрямые среднеквадорат. Регрессии.Коэффиц. регрессии.Остаточнаярегрессия.Центр совместного распределения.

Рассмотрим двумерную величину СВ (Х,У),где Х и У-зависимые СВ будем полагать 1 из них как ф-ю другой.Уz g(x)=kX+b, где к и b-подлежащие определению коэф-ты.Для их определ. Применяют метод наименьших квадратов,закл. В том, что мат. Ожидание М(У-g(х))2 приняло как можно меньше знач.мод наз. Среднеквадр. Регрессией величины У относит. Х.Исследовав ф-ю М((У-g(х))2)=М((У-кХ-b2))получим, что наимен. Ее знач. =σх2(1-τху2) если k= τху  и b=М(У)-τху  М(Х). Величина σу2(1-τ2ху)наз. Остаточной дисперсией У относит. Х,она характеризует ошибку,кот. Достигается при замене У на g(х).Если τху = 1,то остаточная дисперсия =0. K - коэф-т регрессииУ относит. Х, а прямую заданную уравнением у= τху (x-mх)+mуназ. Прямой среднеквадрат. Регрессии У относит.Х. Аналогично можно получить прямую среднеквадрат. Регрессии Х относит. У: Х= τху (у-mу)+mx. Коэф-т регрессии Х относит. У -τху . Остаточная дисперсия Х относит. У. σ2х(1- τху2). Если τху= 1, то обе прямые регрессии совпадают. В любом случае прямые проходят через точку с координатами (mx,my),кот. Наз. Центром совместного распределения Х и У).

 

42. Лин. Корреляц. Распредел. Двумерной случ. Величины.

Если обе ф-ии М(У/Х=х) и М(Х/У-у) линейны, кот. Говорят, что СВ Х и У связаны лин. Коррел. Зависимостью.Графикилин. Ф-й регрессии – прямые линии,совпадающие с прямыми среднеквадрат. Регрессии. ТЕОРЕМА. Если(Х,У)- двумерная СВ,распредел. По норм. Закону, тоХ и У связаны лин. Корреляц. Зависимостью. Док-во. F(х,у)- плотность распредел. Двумерной СВ (Х,У), f1(х) – плотность вероятности .ψ (у/х)= = . Как видно,это норм. Распредел. Мат. Ожидание равно: М(У/Х=х)=а2ху (х-а1). D(У/Х=х)=/у2(1-r2ху).

 

43.Задачи мат. статистики: - указать способы сбора и группировки статистических сведений. – разработать методы анализа статистических данных, в зависимости от целей исследования. 

Выборочный метод - статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку.

Генеральная совокупность – совокупность объектов, из которых производится выборка.

Выборочная совокупность – совокупность случайно отобранных объектов.

Повторной называют выборку, при которой отобранный объект возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот (числа наблюдений называют частотами, а их отношение к объему выборки ni/n=wi– относительными частотами).

Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющая для каждого значения х относительную частоту события Х<x.   F*(x)=nx/n, где nx- число вариант, меньших х,n – объем выборки, Х – статистическое распределение частот количественного признака.

Полигоном частот называют ломанную, отрезки которой соединяют точки (х1, n1), (х2, n2),…, (хk, nk). Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им частоты ni. Точки (хi, ni) соединяют отрезками прямых и получают полигон частот.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты). Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h.

 

44.Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

Несмещенной называют статистическую ошибку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т.е. М (Q*)=Q. Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.

Состоятельной называют статистическую оценку, которая при n → ∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценкипри n → ∞ стремится кнулю, то такая оценка оказывается и состоятельной.

45.Генеральной средней ¯Хг называют среднее арифметическое значении признака генер. совокупности. Если все значения Х1, Х2,…, Хnпризнака генер. совокупности объема N различны, то ¯Хг =( Х1+ Х2+,…, Хn)/N. Если значения признака Х1, Х2,…, ХК имеют соответственно частоты N1, N2, ….Nк ,причем N1+N2+, ….Nк= N, то ¯Хг =(x1N1+x2N2+…+xkNk)/N. Выборочной средней ¯Хв называют среднее арифметическое значение признака выборочной совокупности. . Если все значения Х1, Х2,…, Хnпризнака выборки объема n различны, то ¯Хв =( Х1+ Х2+,…, Хn)/n. Если значения признака Х1, Х2,…, ХК имеют соответственно частоты n1, n2, ….nк ,причем n1+n2+, ….nк= n, то ¯Хв =(x1n1+x2n2+…+xknk)/n. Групповой средней называют среднее арифметическое значений признака, принадлежащее к группе. Общей средней ¯хназыавют среднее арифметическое значений признака, принадлежащих всей совокупности. Модой М0 называют варианту, которая имеет наибольшую частоту. Медианой mе(me= (xk+xk+1)/2)называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Размахом варьирования Rназывают разность между наибольшей и наименьшими вариантами (R= xmax-xmin).Средним абсолютным отклонением Ѳ называют среднее арифметическое абсолютных отклонений (Ѳ=(∑ni|xi-¯Хв|)/∑ni). Коэффициентом вариации Vназывают выражении в процентах отношение выборочного среднего квадратического отклонения к выборочной средней (V=σв/¯Хв *100%).

 

46.. Генеральной дисперсиейDг наз. среднее арифметич. квадратов отклонений знач. признака генер. совок-ти от их сред.знач. . Если все значения х1, х2,…,хn признака генер. совок-ти объема N различны, то  . Если все значения х1, х2,…,хк имеют соответственно частоты N!, N2,…,NK, причем N1+N2+…+Nk=N, то , т.е. генер. дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответств. частотам. Выборочной дисперсиейDв наз. среднее арифметич. квадратов отклонений наблюдаем. значений признака от их сред. значения . . Если все значения х1, х2,…,хn признака выборки объема n различны, то  . Если все значения х1, х2,…,хк имеют соответственно частоты n!, n2,…, nK, причем n1+n2+…+nk=n, то , т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответств. частотам. Групповой средней наз. среднее арифметич. значений признака, принадлежащих группе. Общей средней  наз. среднее арифметич. значений признака, принадлежащих всей совокупности. Общая средняя равна средней арифметич. групп.средних, взвешенной по объемам групп. Модой Мо наз. варианту, кот.имеет наиб частоту. Медианой mе наз. варианту, кот.делит вариац. ряд на две части, равные по числу вариант. Размахом варьирования R наз. разность между наибольшей и наименьшей вариантами: . Средним абсолютным отклонением  наз. сред. арифметич. абсолютных отклонений: . Коэффициентом вариации V наз. выраженное в процентах отношение выборочного среднего квадрат. откл. к выбороч. средней: *100% .

47.Групповой дисперсией наз. дисперсию значений признак, принадлжежащих группе, относительно групповой средней: , где nj-частота значения хi; j – номер группы; -групповая средняя группы j; Nj= -объем группы j. Внутригрупповой дисперсией наз. среднюю арифм. дисперсий, взвешенную по объемам групп: , Nj-объем группы j; -объем всей совокупности. Межгрупповой дисперсией наз. дисперсию групповых средних относительно общей средней: ,  – групповая средняя группы j; Nj-объем группы j; -общая средняя; -объем всей совокупности. Общей дисперсией наз. дисперсию значений признака всей совок-ти относительно общей средней: . Теорема о сложении дисперсий: если совок-ть состоит из нескольких групп, то общая дисперсия равна сумме внутригру. и межгруп. дисперсий: Dобщ=Dвнгр+Dмежгр.

 


Дата добавления: 2018-05-13; просмотров: 319; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!