МОДА, МЕДИАНА И СРЕДНЕЕ ЗНАЧЕНИЕ ОБЪЕДИНЕННЫХ ГРУПП
Мы можем знать средние, медианы и моды для трех разных классов школы и желать найти те же характеристики для объединения всех трех классов. Пусть известны средние и числа учащихся для трех классов А, В и С:
Среднее объединенных групп находится по формуле:
. (3.9)
В нашем случае среднее групп А, B и С будет
.
Мода и медиана для объединенных групп вычисляется заново.
ИНТЕРПРЕТАЦИЯ МОДЫ, МЕДИАНЫ И СРЕДНЕГО ЗНАЧЕНИЯ
Каждая мера центральной тенденции имеет интересную интерпретацию в терминах ошибок, возникающих из-за того, что единственная статистическая характеристика заменяет все значения в группе. Приведем интерпретацию для моды, медианы и среднего.
1. Смысл, в котором мода является наиболее представительным значением или значением, которое наилучшим образом «заменяет все значения», вполне ясен. Если мы вынуждены выбрать одно число для замены любого из значений, то совпадение было бы максимальное число раз, если бы выбранное число было модой группы.
2. Интерпретация медианы группы не столь очевидна.
Медиана представляет собой такую точку на числовой оси, для которой сумма абсолютных (то есть без учета знака) разностей всех значений меньше суммы разностей для любой другой точки:
(3.10)
Если вместо каждого значения выбрать медиану, то достигается минимальная ошибка – при условии, что «ошибка» определяется как сумма абсолютного отличия каждого значения от оценки.
|
|
3. Если взамен каждого значения берется среднее, обеспечивается минимальная ошибка – при условии, что «ошибка» определяется как сумма квадратов разностей каждого значения с оценкой.
ВЫБОР МЕР ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Выбор меры центральной тенденции требует некоторых размышлений:
1. Мода наиболее просто вычисляется. Для очень больших групп данных это достаточно стабильная мера центра распределения. Во многих распределениях значительного числа измерений, используемых в педагогике и психологии, мода близка к двум другим мерам – медиане и среднему.
В малых группах мода может быть совершенно нестабильной. Мода группы (1, 1, 1, 3, 5, 7, 7, 8) равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода станет равной 7.
2. Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления, если последнее осуществляется вручную.
На медиану не влияют величины «больших» и «малых» значений. Например, в группе из 50 данных медиана не изменится, если наибольшее значение утроится.
3. На величину среднего влияют значения всех результатов, медиана и мода не требуют для определения всех значений.
|
|
Если одно какое-нибудь значение меняется на с единиц, изменится в том же направлении на с/п единиц.
На величину среднего особенно влияют результаты, которые можно назвать «выбросами», то есть данные, находящиеся далеко от центра группы оценок.
4. Некоторые множества данных просто «не имеют центральной тенденции», что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду.
5. Центральная тенденция групп данных, содержащих крайние значения, возможно, наилучшим образом измеряется медианой, когда гистограмма унимодальна. Одно крайнее значение может сместить среднее группы гораздо дальше того места, которое вообще стоит рассматривать как центральную область.
Например, если 9 человек имеют доходы от 4500 до 5200 тенге со средним 4900 тенге, а доход десятого составляет 20000 тенге, то средний доход для 10 лиц будет 6410 тенге. Эта цифра не позволяет судить обо всей группе, хотя она выглядела внушительно для руководителя маленькой фирмы (чье жалованье составляет 20000 тенге), который хочет охарактеризовать среднюю зарплату по платежной ведомости. В этом примере в качестве меры центральной тенденции следовало бы избрать медиану. Демографы, экономисты и журналисты часто выбирают для отчетов «доход по медиане», поскольку стремятся избежать только что описанной ситуации.
|
|
6. В унимодальных выборках, которые симметричны, среднее, медиана и мода совпадают. На рисунке 3.2 полигон частот показывает, что среднее, медиана и мода равны 50.
Рис.3.2. Симметричная унимодальная группа данных
Отсутствие полной симметрии в полигоне частот или гистограмме обычно оказывает определенное влияние на соотношение между средним, медианой и модой. Предположим, что преобладающее большинство данных некоторой группы расположено выше вершины полигона частот, как, например, на рисунке 3.3:
|
Рис.3.3. Несимметричный полигон частот
На рисунке 3.3 мода (Мо) равна 100, медиана (Md) составляет 105, а среднее = 107,2. Если большинство оценок окажется ниже вершины полигона частот, то среднее станет минимальным, медиана больше, а мода максимальной.
Замечание
Существует много других способов определения «центрального значения» в группе данных, например среднее геометрическое и среднее гармоническое.
|
|
Среднее геометрическое находится по формуле:
.
Среднее гармоническое используется иногда для усреднения группы отношений:
.
Среднее геометрическое и среднее гармоническое редко встречаются в литературе по педагогике и психологии.
ВОПРОСЫ И УПРАЖНЕНИЯ
1. Дайте определение моде, медиане и среднему значению.
2. Найдите среднее, медиану и моду следующих множеств:
§ 2, 7, 4, 5, 2;
§ 3, 1, 0, 7, 2, 6, 2, 6;
§ 1, 7, 3, 8, 3, 3, 9, 11, 9, 12, 9, 12, 13
§ 22, 15, 16, 21, 24, 24, 27, 28, 30, 30, 31 , 31, 31, 34, 36.
3. Пусть к каждому из 15 значений последнего множества из упражнения 2 прибавлено 4. Чему будут равны среднее и медиана этих увеличенных значений?
4. В классе А – 10 учащихся, среднее и медиана результатов контрольной работы равны соответственно 4,2 и 4. В классе Б – 20 учащихся, среднее и медиана результатов контрольной работы которых равны 4,3 и 4,5 соответственно. Чему равны среднее и медиана 30 значений , полученных в результате объединения оценок в классах А и Б?
5. На какую меру центральной тенденции влияют значения всех результатов?
ТЕМА 4
МЕРЫ ИЗМЕНЧИВОСТИ
Меры центральной тенденции говорят о концентрации группы значений на числовой шкале. Каждая мера дает такое значение, которое «представляет» в каком-то смысле все оценки группы. В этом случае пренебрегают различиями, существующими между отдельными значениями. Для измерения вариации оценок внутри группы требуются другие описательные статистики.
Всякая научная деятельность связана с понятием изменчивости. Когда есть много необъяснимых причин вариабельности, прогнозы не будут очень точными. Зато, когда объяснения причин различий людей и вещей представлены в виде некоторой модели, неопределенность можно уменьшить, а часть вариации устранить.
Например, если бы было совсем неизвестно, почему люди различаются между собой по умственному развитию, то попытка прогнозировать интеллект наталкивалась бы на большую неопределенность; некоторые люди выглядели бы «смышлеными», а другие – «глупыми», и никто не знал бы, почему. Однако если известно, что наследственность и окружающая среда оказывают количественное влияние на IQ, то информация о происхождении ребенка и его воспитании в раннем детстве позволила бы дать более точный прогноз его умственного развития в зрелости. Другими словами, вариабельность IQ у лиц со сходной наследственностью и окружающей средой меньше, чем у людей вообще.
РАЗМАХ
Размах (иногда эту величину называют разбросом выборки) измеряет на числовой шкале расстояние, в пределах которого изменяются оценки, и обозначается буквой R. Это самый простой показатель, который можно получить для выборки, – разность между максимальным и минимальным значениями вариационного ряда, т.е.
(4.1)
Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.
Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.
Дата добавления: 2019-09-13; просмотров: 739; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!