Связь выбора метода статистического анализа со шкалой измерения
Выбор метода статистического анализа полученных эмпирических данных — очень важная и ответственная часть исследования.
При выборе статистического критерия нужно, прежде всего, идентифицировать тип переменных (признаков) и шкалу измерения, которая использовалась при измерении показателей и других переменных — например, возраст, состав семьи, уровень образования. В качестве переменных могут выступать любые показатели, которые можно сравнивать друг с другом (то есть измерять). Следует иметь в виду, что в исследованиях могут широко использоваться номинативные и порядковые шкалы: вербальные и невербальные поведенческие реакции пол, уровень образования — все это может рассматриваться в качестве переменных. Главное — иметь четкие и ясные критерии их отнесения к тому или иному типу в зависимости от поставленных гипотез и задач.
При выборе статистического критерия нужно ориентироваться также на тип распределения данных, который получился в исследовании. Параметрические критерии используются в том случае, когда распределение полученных данных рассматривается как нормальное. Нормальное распределение с большей вероятностью (но не обязательно) получается при выборках более 100 испытуемых (может получиться и при меньшем количестве, а может не получиться и при большем). При использовании параметрических критериев необходима проверка нормальности распределения.
|
|
Для непараметрических критериев тип распределения данных не имеет значения. При небольших объемах выборки испытуемых целесообразно выбрать непараметрические критерии, которые дают большую достоверность выводам, независимо от того, получено ли в исследовании нормальное распределение данных. В некоторых случаях статистически обоснованные выводы могут быть сделаны даже при выборках в 5—10 испытуемых.
Во многих исследованиях осуществляется поиск различий в измеряемых показателях у испытуемых, имеющих те или иные особенности. При обработке соответствующих данных могут использоваться критерии для выявления различий в уровне исследуемого признака или в его распределении. Для определения значимости различий в проявлении признака в исследованиях часто используются такие показатели, как парный критерий Вилкоксона, U-критерий Манна—Уитни, критерий х-квадрат (х2), точный критерий Фишера, биномиальный критерий.
Во многих исследованиях осуществляется поиск взаимосвязи исследуемых показателей у одних и тех же испытуемых. Для обработки соответствующих данных могут использоваться коэффициенты корреляции. Связь величин друг с другом и их зависимость часто характеризуется коэффициентом линейной корреляции Пирсона и коэффициентом ранговой корреляции Спирмена.
|
|
Табулирование данных: таблица исходных данных
Для анализа и интерпретации исходных количественных данных их необходимо обобщить.
Когда исходная выборка имеет достаточно большой объем, то используют табулирование данных – т.е. представляют исходную выборку в виде таблицы соответствующего вида. Табулирование обычно осуществляется в 4 этапа:
1 этап – определение размаха выборки. Для этого из максимального элемента выборки вычитают минимальный.
2 этап – определение ширины интервала, группирование данных. Прежде чем искать ширину интервала, необходимо определиться с количеством интервалов в группировании. Очень небольшое количество интервалов может слишком упростить и сгладить общую тенденцию, а слишком большое количество интервалов может привести к излишней детализации рассматриваемого явления. Рекомендация: количество интервалов выбирается таким образом, чтобы в каждый интервал попадало в среднем 5-6 элементов выборки. Для этого объем выборки делим на 5 и на 6, в результате получаем два числа.
3 этап – определение границ интервалов группирования данных.
|
|
4 этап – непосредственно само табулирование данных. На этом этапе мы подсчитываем, сколько элементов выборки попало в каждый интервал. Количество наблюдений, попавших в интервал, называется частотой. Результатом табулирования данных является таблица, состоящая из двух столбцов, первый из которых содержит границы интервала, второй – частоты.
Основой для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испытуемого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемым. Таким образом, в каждой ячейке (клетке) таблицы записано только одно значение одного показателя одного испытуемого.
Дата добавления: 2018-08-06; просмотров: 446; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!