Понятие описательных статистик
Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.
Описательная статистика нужна, как правило, для понимания характера совокупности, сырых данных. Включает в себя различные методы агрегирования данных. Общие из них таковы:
1. Частотный анализ
· Анализ гистограммы (позволяет выявить характер распределения данных)
· Подгонка распределения (Для прогноза часто необходимо знать закон распределения.Для определения закона, в большинстве случаев нужно подогнать наблюдаемое распределение под теоретическое, сравнением наблюдаемых частот в данных с ожидаемыми частотами в теоретическом распределении)
2. Вычисление и анализ показателей центра распределения
· Мода (наиболее часто встречающееся значение варьирующего признака в вариационном ряду)
· Медиана (значение, которое разбивает выборку на две равные части.Половина наблюдений лежит ниже медианы, и половина наблюдений лежит выше медианы.)
· Среднее (среднее арифметическое, рассчитанное путем сложения группы чисел и деления на количество этих чисел)
3. Оценка разброса данных в совокупности
|
|
· Стандартное отклонение (мера того, насколько широко разбросаны точки данных относительно их среднего)
· Дисперсия (отклонение наблюдаемого значения (для каждого наблюдения) от среднего арифметического.)
· Коэффициенты вариации (Мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет её средний разброс.Коэффициент вариации равен отношению стандартного отклонения к среднему значению)
Понятие мер центральной тенденции
Центральная тенденция – то количественное (численное) значение признака, к которому тяготеет переменная величина. Поскольку понятие «тяготеет» несколько произвольно и с математической точки зрения не вполне корректно, имеет смысл рассмотреть различные меры центральной тенденции более подробно.
В психологических исследованиях в качестве мер центральной тенденции чаще всего используются мода, медиана и среднее арифметическое значение. Значительно реже используются такие меры как среднее геометрическое, среднее гармоническое, обратное среднее гармоническое значение и др.
Самой известной из таких мер является среднее (точнее среднеарифметическое) значение (М). Оно находится сложением всех результатов и делением получившейся суммы на число случаев (N).
|
|
Другой мерой центральной тенденции является мода. Мода — это просто наиболее часто встречающееся в определенной совокупности наблюдений значение переменной. При сгруппированных данных мода определяется как середина интервала группирования, содержащего наибольшее число значений наблюдаемой переменной.
Третья мера центральной тенденции - это медиана, т.е. результат, находящийся в середине последовательности показателей, если их расположить в порядке возрастания или убывания. Медиана есть точка, делящая распределение ровно пополам, причем одна половина результатов лежит справа от нее, а другая слева.
Меры центральной тенденции: мода. Мономодальное, бимодальное и полимодальное распределения
Мода (Mo) - это наиболее часто встречающееся значение варьирующего признака в вариационном ряду. Модой распределения называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие.
1 , 2, 3, 2, 5, 56, 3, 2, 8
Mo = 2
Мода не является достаточно строгой мерой центральной тенденции, поскольку она не учитывает характера распределения переменных, а значит может использоваться лишь в предварительных выводах и прогнозах. Кроме того, необходимо использовать моду только для больших объемов выборок, поскольку для малых она недостаточно информативна.
|
|
В зависимости от того, сколько значений признака удовлетворяют определению моды, различают
· мономодальные (имеющие одну моду),
· бимодальные (имеющие две моды)
· полимодальные распределения (имеют более чем две моды)
А также различают распределения, не имеющие моды (все значения признака встречаются примерно с одинаковой частотой). В бимодальном и полимодальном распределениях, в свою очередь, можно определить наибольшую и наименьшую моды.
Не подходит для описания непрерывных данных. Мода может не существовать или быть не единственной.
Дата добавления: 2018-08-06; просмотров: 596; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!