Связь выбора метода статистического анализа со шкалой измерения

Выбор метода статистического анализа полученных эмпирических данных — очень важная и ответственная часть исследования.

При выборе статистического критерия нужно, прежде всего, идентифицировать тип переменных (признаков) и шкалу измерения, которая использовалась при измерении показателей и других переменных — например, возраст, состав семьи, уровень образования. В качестве переменных могут выступать любые показатели, которые можно сравнивать друг с другом (то есть измерять). Следует иметь в виду, что в исследованиях могут широко использоваться номинативные и порядковые шкалы: вербальные и невербальные поведенческие реакции пол, уровень образования — все это может рассматриваться в качестве переменных. Главное — иметь четкие и ясные критерии их отнесения к тому или иному типу в зависимости от поставленных гипотез и задач.

При выборе статистического критерия нужно ориентироваться также на тип распределения данных, который получился в исследовании. Параметрические критерии используются в том случае, когда распределение полученных данных рассматривается как нормальное. Нормальное распределение с большей вероятностью (но не обязательно) получается при выборках более 100 испытуемых (может получиться и при меньшем количестве, а может не получиться и при большем). При использовании параметрических критериев необходима проверка нормальности распределения.

Для непараметрических критериев тип распределения данных не имеет значения. При небольших объемах выборки испытуемых целесообразно выбрать непараметрические критерии, которые дают большую достоверность выводам, независимо от того, получено ли в исследовании нормальное распределение данных. В некоторых случаях статистически обоснованные выводы могут быть сделаны даже при выборках в 5—10 испытуемых.

Во многих исследованиях осуществляется поиск различий в измеряемых показателях у испытуемых, имеющих те или иные особенности. При обработке соответствующих данных могут использоваться критерии для выявления различий в уровне исследуемого признака или в его распределении. Для определения значимости различий в проявлении признака в исследованиях часто используются такие показатели, как парный критерий Вилкоксона, U-критерий Манна—Уитни, критерий х-квадрат (х2), точный критерий Фишера, биномиальный критерий.

Во многих исследованиях осуществляется поиск взаимосвязи исследуемых показателей у одних и тех же испытуемых. Для обработки соответствующих данных могут использоваться коэффициенты корреляции. Связь величин друг с другом и их зависимость часто характеризуется коэффициентом линейной корреляции Пирсона и коэффициентом ранговой корреляции Спирмена.

Табулирование данных: таблица исходных данных

Для анализа и интерпретации исходных количественных данных их необходимо обобщить.

Когда исходная выборка имеет достаточно большой объем, то используют табулирование данных – т.е. представляют исходную выборку в виде таблицы соответствующего вида. Табулирование обычно осуществляется в 4 этапа:

1 этап – определение размаха выборки. Для этого из максимального элемента выборки вычитают минимальный.

2 этап – определение ширины интервала, группирование данных. Прежде чем искать ширину интервала, необходимо определиться с количеством интервалов в группировании. Очень небольшое количество интервалов может слишком упростить и сгладить общую тенденцию, а слишком большое количество интервалов может привести к излишней детализации рассматриваемого явления. Рекомендация: количество интервалов выбирается таким образом, чтобы в каждый интервал попадало в среднем 5-6 элементов выборки. Для этого объем выборки делим на 5 и на 6, в результате получаем два числа.

3 этап – определение границ интервалов группирования данных.

4 этап – непосредственно само табулирование данных. На этом этапе мы подсчитываем, сколько элементов выборки попало в каждый интервал. Количество наблюдений, попавших в интервал, называется частотой. Результатом табулирования данных является таблица, состоящая из двух столбцов, первый из которых содержит границы интервала, второй – частоты.

Основой для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испытуемого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемым. Таким образом, в каждой ячейке (клетке) таблицы записано только одно значение одного показателя одного испытуемого.

Дата добавления: 2018-08-06; просмотров: 446; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 123 4 5 6 7 8 9 10 Следующая ⇒

Мы поможем в написании ваших работ!