Расчет параметров распределения



 

  Х Отклонение от среднего  (Xi - Mx)   (Xi - Mx) 2   (Xi - Mx) 3   (Xi - Mx) 4
48 8 64 512 4096
47 7 49 343 2401
43 3 9 27 81
41 1 1 1 1
41 1 1 1 1
40 0 0 0 0
38 -2 2 -8 16
36 -4 16 -64 256
34 -6 36 -216 1296
32 -8 64 -512 4096
SХ=400 Mx=40   S(Xi - Mx) 2 =244 S(Xi - Mx) 3=84 S(Xi - Mx)4=12244

 Модальное значение Mo=41, поскольку оно встречается дважды. Медиана Me= 40.5 (пять чисел меньше этой величины, пять больше). Среднее арифметическое Mx равно 400/10 = 40.

Дисперсия s2 =244/9=27.11

Стандартное отклонение s =5.207.

Коэффициент асимметрии As = 0.011

Коэффициент эксцесса Ex = -1.334

При работе на компьютере параметры распределения можно рассчитать, используя встроенные функции Microsoft Excel. Для этого надо войти в раздел “Анализ данных” из меню “Сервис” (при первом использовании пакет анализа подключается через меню “Сервис”, подменю “Надстройки”), где выбрать подраздел “Описательная статистика”. На экране при этом высвечивается меню “Описательная статистика”, в котором задаются входной интервал переменной и выходной интервал для вывода результатов расчета. Входной интервал переменной задается через двоеточие, например интервал “a1:a24” включает в себя 24 значения переменной в столбце A с 1 по 24 ячейку. Можно рассчитывать параметры распределения сразу нескольких переменных, если они представляют собой единый массив данных. Так, входной интервал a1:c25 включает в себя три переменных по 25 значений в каждой: a1:a25, b1:b25 и c1:c25. Если в первой строке интервала находится заголовок столбца (строки), то это следует указать в специальном окошке меню. В окне “Выходной интервал” следует указать номер левой верхней ячейки выходного интервала. Выходные данные включают среднее арифметическое значение, стандартную ошибку среднего, медиану, моду, стандартное отклонение, дисперсию выборки, коэффициенты эксцесса и асимметрии, размах выборки (обозначен как “Интервал”), минимальное и максимальное значения (“Минимум” и “Максимум”), сумму всех значений и количество значений переменных (“Счет”). Следует учесть, что в Microsoft Excel коэффициенты асимметрии и эксцесса рассчитываются по формулам, несколько отличающимся от приведенных выше.

 

Нормальное распределение

 

Нормальным называется распределение, относительные частоты f0 которого выражаются формулой:

                            

По этой формуле при различных значениях среднего арифметического и стандартного отклонения получается семейство нормальных кривых. Нормальное распределение характеризуется тем, что крайние значения признака встречаются относительно редко, а близкие к среднему арифметическому - относительно часто. Кривая нормального распределения имеет колоколообразную форму - это одномодальное распределение, значения медианы, моды и среднего арифметического которого совпадают между собой, коэффициенты асимметрии и эксцесса равны нулю.

Рис. 4. Кривая нормального распределения.

 

Кривая асимптоматически приближается к оси Х, то есть может принимать сколь угодно малые значения по ординате при стремлении Х к плюс или минус бесконечности. В зависимости от величины стандартного отклонения кривая может растягиваться или сжиматься по оси Х, а в зависимости от значения среднего арифметического она будет перемещаться влево или вправо.

Назвали распределение нормальным потому, что оно очень часто встречалось при естественнонаучных исследованиях, и его считали нормой всякого массового случайного проявления признаков. Считается, что нормальное распределение характеризует такие случайные величины, на которое воздействует большое количество факторов, причем сила воздействия одного отдельно взятого фактора значительно меньше суммы воздействия остальных факторов. По нормальному закону распределены многие биологические параметры - например, вес, рост человека. По нормальному закону распределяется и ряд психологических свойств, качеств человека - показатели интеллекта, агрессивности, тревожности и другие. Из этой предпосылки исходят при разработке и стандартизации тестовых методик.

Особое место среди нормальных распределений занимает так называемое стандартное или единичное нормальное распределение. Такое распределение получается при условии, что среднее арифметическое равно нулю, а стандартное отклонение - единице: Мх=0, s=1. Стандартное распределение удобно тем, что к нему может быть сведено любое другое нормальное распределение путем операции стандартизации. Операция стандартизации заключается в следующем: из каждого индивидуального значения параметра вычитается среднее арифметическое значение (это называется центрированием), а полученная разность делится на значение стандартного отклонения (нормирование). Стандартизированное значение принято обозначать символом z:

Стандартизация позволяет анализировать любые нормальные распределения на основе знания характеристик единичного нормального распределения, которые приведены в таблице (Таблица1 Приложения). В этой таблице указана кумулятивная (накопленная) вероятность - то есть доля площади под кривой слева от заданной точки от общей площади (общая площадь под кривой принята равной 1.000). Зная параметры распределения величины Мх и s, мы можем оценить вероятность появления наблюдений с тем или иным значением.

Например, количество прочитанных первоклассниками печатных знаков в единицу времени после обучения их по новой методике составляет: среднее значение Мх=142 знака в минуту при стандартном отклонении s =47. Какова вероятность того, что при случайном выборе ученика для контроля нам попадется ученик, читающий 30 знаков или менее?

                      

По таблице значений кумулятивной функции распределения стандартного отклонения находим, что кумулятивная вероятность выбора такого ученика равна 0.0082 (то есть 0,8%).

Какова же вероятность выбора ученика, читающего менее 200 знаков?              

                                                 

По таблицам находим, что кумулятивная вероятность такого выбора составляет 0.8849, то есть вероятность получения данной величины равна 0.8849 (примерно 88.5%). Соответственно, вероятность выбора ученика, читающего более 200 знаков, будет 1- 0.8849 = 0.1151, то есть чуть более 10%.

Чтобы подсчитать вероятность выбора ученика, читающего от 150 до 200 знаков, надо рассчитать кумулятивную вероятность для 200 (она равна 0.8849) и для 150 (0.5793) и взять разность между этими значениями. Мы получаем величину 0.3056, то есть примерно 30%.

Зная характеристики нормального распределения, установлено, что примерно 2/3 наблюдений, а именно 68.3%, сгруппированы в интервале среднее арифметическое плюс-минус стандартное отклонение Мх ±s ; в интервале Мх ±2s находятся 95.4% наблюдений; а в интервале Мх ±3s 99.7% всех наблюдений.

Поскольку операция стандартизации нормального распределения сводит любое нормальное распределение к стандартному нормальному, не имеющему размерности, то появляется возможность сравнивать между собой нормальные распределения величин, измеренных в разных единицах (метры с килограммами, баллы с градусами и так далее).

 


Дата добавления: 2018-05-12; просмотров: 816; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!