Основные методы математической статистики и форма



Глава 7. Основы математико-статистической обработки данных

Психологического исследования и форма представления результатов

Методы и способы математико-статистической обработки у студентов гуманитарных факультетов, в том числе и психологических, вызывают значительные затруднения и, как следствие, боязнь и предубеждение в возможности их овладением. Однако, как показывает практика, это ложные заблуждения. Следует понять, что в современной психологии, в практической деятельности психолога любого уровня без использования аппарата математической статистики все ваши выводы могут восприниматься не более как умозрительные, с известной долей субъективности. С другой стороны, по мере накопления практического опыта, базы данных эмпирических исследований, неизбежно встает задача их обобщения, выявления тенденций, динамики, характерных черт, особенностей, которые невозможно обоснованно интерпретировать, не используя математические методы количественного анализа.

Следует уяснить основные принципы использования математико-статистических методов в психологии:

- без использования и владения аппаратом математической статистики вы не можете считать себя квалифицированным психологом;

- аппарат математической статистики в психологии лишь инструмент для обоснования достоверности ваших выводов и математические критерии никогда не рассматривались в психологии в качестве абсолютной истины. В тоже время, игнорирование их ни в коем случае недопустимо и требует при необходимости дополнительного обоснования;

- в зависимости от того, как вы используете математико-статистический инструментарий, таковы и будут ваши выводы (в такой же мере ваши выводы могут быть оспорены другими исследователями при использовании других методов).

Изучая основы статистики, не следует бояться математических формул, без знания некоторых из них, несомненно, не обойтись, но главное понимать какую психологическую реальность они описывают, какой психологический смысл в них содержится. И тогда за математическими формулами, уровнями достоверности (статистической значимости), критическими значениями коэффициентов откроются психологические реалии, их значение и смысл.

Начнем с некоторых практических рекомендаций:

- всегда самое трудное - начало, но это зависит только от вашего желания и целеустремленности;

- начинать необходимо с четкого уяснения базовых понятий, определений. В математической статистике они достаточно четко определены и не допускают двойственных толкований;

- в каждом методе, формуле уясните смысл того, для чего они используются в психологическом исследовании, какие результаты они дают, и каким образом их можно и должно будет интерпретировать.

Анализ первичных статистик

Для определения способов математико-статистической обработки, прежде всего, необходимо оценить характер распределения данных по всем исследуемым психологическим признакам. Для психологических признаков, имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики, которые во многих случаях являются более мощными, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения [17, 25, 40, 60].

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение - модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Графически характер такого распределения описывается кривой К. Гаусса (См. Рисунок 7.1). Такой характер распределения часто встречается в исследовании психических явлений, особенно в больших выборках, поэтому исследователь в области психологии чаще всего в каждом случае выявляет характер распределения исследуемого признака.

Необходимо запомнить! Характер распределения выявляется, главным образом, с целью определиться в методах математико-статистической обработки данных. Если характер распределения показателей психологического признака имеет нормальное или близкое к нормальной форме распределения признака, описываемой кривой Гаусса, то мы можем использовать параметрические методы математической статистики, как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками по t-критерию Стьюдента, F-критерию Фишера, коэффициент корреляции Пирсона и др. Если, кривая распределения показателей психологического признака далека от нормальной, то мы вынуждены будем использовать непараметрическойметоды математической статистики: расчет достоверности отличий по критерию Q Розенбаума (для малых выборок), по критерию U Манна-Уитни, коэффициент ранговой корреляции Спирмена, факторный, многофакторный, кластерный и другие методы анализа. Помимо этого, по характеру распределения можно составить общее представление об общей характеристике выборки испытуемых по данному признаку и тому, на сколько данная методика соответствует (т. е. «работает», валидна) данной выборке.

 

Основными важнейшими первичными статистиками характеризующими распределение исследуемого признака являются:

Средняя арифметическая — это величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой (М) или (X). Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений.

Среднее квадратичное отклонение(обозначаемое греческой буквой σ - сигма) и называемое также основным, или стандартным, отклонением) - мера разнообразия входящих в группу объектов; она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах — разность между наибольшим и наименьшим значением в ряду. Однако сигма полнее характеризует разброс значений относительно средней арифметической.

Следует иметь в виду, что сигма (σ) - величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Поэтому по сигме можно сравнивать изменчивость лишь одних и тех же показателей, а сопоставлять сигмы разных признаков по абсолютной величине нельзя. Для того, чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в различных единицах измерения) и избежать влияния масштаба измерений средней арифметической на величину сигмы, применяют коэффициент вариации, который представляет собой по существу приведение к одинаковому масштабу величины (σ).

Для нормального распределения существуют точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант:

1) слева и справа от средней арифметической лежит 50% вариант;

2)  в интервале от М - 1σ до М + 1σ ≈ 68 % вариант;

3)  в интервале от М - 1.96 σ до М + 1.96 σ ≈ 95% вариант.

(см. Рисунок 7.1)

                                                                 50%

                                                                                                                               

                          М-1σ                 68%            М+1σ  

   

    М-1,96σ                             95%                                М+1,96σ

Рисунок 7.1

Таким образом, ориентируясь на эти характеристики нормального распределения, можно оценить степень близости к нему рассматриваемого распределения психологического признака.

Следующими по важности характеристиками распределения показателей признака являются такие первичные статистики, как коэффициент асимметрии и эксцесс.

Коэффициент асимметрии - показатель скошенности распределения в левую или правую сторону по оси абсцисс. Если правая ветвь кривой длиннее левой - говорят о правосторонней (положительной) асимметрии (Рисунок 7.2); если левая ветвь длиннее правой – говорят о левосторонней (отрицательной) асимметрии (Рисунок 7.3).

частоты                                                       баллы Рисунок 7.2 - Правосторонняя               асимметрия частоты                                                                                                    баллы Рисунок 7.3 - Левосторонняя асимметрия

Эксцесс показатель островершинности. Кривые, более высокие в своей средней части - островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины - с прогибом в средней части (Рисунок 7.4).

Вариант А)     Вариант Б)     Вариант В)  

Рисунок 7.4. - Показатели эксцессивности распределения

Эти параметры позволяют составить первое приближенное представление о характере распределения:

1) у нормального распределения редко можно обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1 и +1);

2) эксцесс у признаков с нормальным распределением обычно имеет величину в диапазоне 2 – 4.

Однако, это только приблизительная оценка. Точную и строгую оценку нормальности распределения можно получить, используя один из существующих методов проверки (см. например, Суходольский Г.В. Основы математической статистики для психологов. – СПб., 1998; Математические методы в психологии. – СПб., 2003.)

В более простом варианте показатели асимметрии и эксцесса с их ошибками репрезентативности определяются по следующим формулам (см. Сидоренко Е.В., 1996, с. 232-233):

Общей причиной отклонения формы выборочного распределения признака от нормального вида чаще всего является особенность процедуры измерения: используемая шкала может обладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости [40, с. 61].

Такие эмпирические отклонения от нормального вида, как право- или левосторонняя асимметрия или незначительный эксцесс (или бимодальное распределение) довольно часто встречаются на практике. Связано это с особенностями экспериментальной выборки и используемыми измерительными процедурами.

В то же время, рассматриваемые в учебном пособии методы статистического анализа эмпирических данных вполне допускают отклонения от нормального распределения (одни - в большей степени, другие - в меньшей).

Но, в случае, если требуется убедительное обоснование, полученных результатов и производимых по ним вычислений, следует использовать, в качестве дополнительных несложные методы непараметрической статистики.

Следующий момент, на который следует обратить особое внимание, относится к интерпретации психологического значения, выявляемого данным характером распределения. Что же выявляет кривая Гаусса в характеристике психологических явлений? Какой психологический смысл раскрывает кривая распределения данных, оценок, тестовых баллов исследуемого психологического признака? 

Следует иметь в виду, что кривая распределения тестовых баллов (оценок, результатов выполнения заданий и т. д.) с одной стороны, отражает свойства пунктов, из которых составлен тест (задание), а с другой стороны, характеризует состав выборки испытуемых, т. е. на сколько успешно они справляются с заданием, насколько данный тест (задание) дифференцирует выборку по соответствующему качеству, признаку.

Если кривая имеет правостороннюю асимметрию[1]) то это значит, что в тесте преобладают трудные задания (для данной выборки) (см. Рисунок 7.2); если кривая имеет левостороннюю асимметрию, то значит большинство пунктов в тесте – легкие (слабые) (см. Рисунок 7.3).

Таким образом, имеется два варианта объяснения:

а) тест (задание) плохо дифференцирует испытуемых с низким уровнем развития способностей (свойств, качеств, характеристик): большинство испытуемых получают примерно одинаковый, низкий балл.

б) тест хуже дифференцирует испытуемых с высоким развитием способностей (свойств, качеств, характеристик): большинство испытуемых получают достаточно высокий балл.

Анализ эксцесса кривой распределения позволяет сделать следующие выводы в зависимости от формы распределения показателей (данных, вариант) психологического признака:

а) в случае, когда возникает значительный положительный эксцесс (эксцессивная кривая) и вся масса баллов скучивается вблизи среднего значения (Рисунок 7.4 – Вариант А), возможны следующие объяснения:

- ключ составлен неверно – объединены при подсчете отрицательно связанные признаки, которые взаимоуничтожают баллы. Но, в практике психолога, который работает с валидными и надежными методиками, такие случаи исключаются (кроме собственной невнимательности и безответственности);

- испытуемые применяют, разгадав направленность теста (опросника), специальную тактику «медианного балла» - искусственно балансируя ответы «за» и «против» одного из полюсов измеряемого психологического признака.

б) если подбираются пункты, тесно положительно коррелирующие между собой (т. е. испытания не являются статистически независимыми), то в распределении баллов возникает отрицательный эксцесс, принимающий форму плато (Рисунок 7.4 – Вариант Б).

в) максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершины распределения – до образования двух вершин – двух мод (с «провалом» между ними – Рисунок 7.4 – Вариант В). Такая бимодальная конфигурация распределения баллов указывает на то, что выборка испытуемых разделилась на две категории, подгруппы (с плавным переходом между ними): одни справились с большинством заданий (согласились с большинством вопросов), другие – не справились (не согласились). Такое распределение свидетельствует, что в основе заданий (пунктов) лежит какой-то один общий им всем признак; соответствующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, знание, умение), то они справляются с большинством пунктов, заданий, если нет этого свойства – то не справляются [42, c. 55-56].

Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант Большие величины эксцесса и асимметрии часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру для компьютерной обработки. Грубые промахи при введении данных в обработку можно обнаружить, если сравнить величины сигм у аналогичных параметров. Выделяющаяся величиной сигма может указывать на ошибки.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные - трижды), причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.

Другой причиной больших показателей эксцесса и асимметрии может являться недостаточная надежность и валидность методик, используемых для данной популяции.

В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое, всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторую большую или меньшую ошибку. Такие ошибки, представляющие собой ошибки обобщения, экстраполяции, связанные с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, называются ошибками репрезентативности.

Репрезентативность - степень соответствия выборочных показателей генеральным параметрам.

Статистические ошибки репрезентативности показывают, в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) наши частные определения, полученные на основе конкретных выборок. Очевидно, величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, характеризующих варьирование выборочных показателей вокруг их генеральных параметров.

Поэтому в число первичных статистик обязательно входитстатистическая ошибка средней арифметической. Формула для ее вычисления такова:

                                               mM = ± ;                                                                                           (7.2)                                                                                                                           где mM - ошибка средней арифметической; σ - сигма, стандартное отклонение; n- число значений признака.

 

Перечисленные основные первичные статистики позволяют оценить характер распределения данных в экспериментальном массиве и использовать основные методы параметрической и непараметрической статистики для обоснования результатов эмпирического психологического исследования.

 

Основные методы математической статистики и форма


Дата добавления: 2018-06-01; просмотров: 1268; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!