Анализ данных в управлении: наука или искусство?



В любой сфере человеческой деятельности — в предпринимательстве и бизнесе, науке, культуре, искусстве, управлении — накапливается огромное количество самой разнообразной информации. Реальные успехи в каждой из этих сфер во многом зависят от того, насколько правильно используется эта информация. Чтобы успешно решить эту задачу, необходимо обратиться к к специальным методам анализа и обработки информации. Здесь недостаточно располагать информационными технологиями. Классические информационные технологии позволяют эффективно хранить, структурировать и быстро извлекать информацию в виде, удобном для пользователя, но это — только половина дела. При решении задач управления необходимо выяснить скрытые закономерности, установить силу связи между различными характеристиками, выявить информативные показатели, классифицировать исследуемые статистические объекты — т.е. все то, что принято называть термином «анализ данных».

Сложность алгоритмов современных методов анализа данных, основанных, как правило, на теории вероятностей и математической статистике, во многом ограничивает их использование на практике. Не очень «выручает» и наличие на компьютерном рынке таких «продвинутых» программных комплексов, как пакет статистического анализа данных общественных наук SPSS, являющийся самой распространенной программой для обработки статистической информации. Этот программный комплекс, развиваемый уже на протяжении 35 лет (11-я версия выпущена в мае 2002 г.) и недавно принятой в России в качестве «стандартного» для региональных органов государственной статистики, предоставляет широкий охват существующих статистических методов, который удачно сочетается с большим количеством удобных средств визуализации результатов обработки. 

Однако недостаточно располагать самым совершенным программным продуктом. Анализ данных — это не только наука, но и искусство, и как любое искусство, требует таланта и интуиции, но главное — опыта. Многолетняя работа автора в области анализа данных убеждает: интуиция может развиться только на основе опыта, путем многократных проб и ошибок. Современные пакеты статистических программ позволяют ускорить этот процесс, а наличие удобных средств визуализации результатов обработки — сделать его наглядным и привлекательным для пользователя с гуманитарным складом мышления. Тем самым анализ данных становится и наукой, и искусством.

Что же следует понимать под термином «анализом данных» в управлении? Подойдем к этому с двух точек зрения — «статистической», что соответствует междисциплинарному подходу, и «социологической», учитывающей человеческий фактор.

Анализу данных известный специалист в области социологии управления В.А. Ядов в своей книге посвящает отдельную главу «Анализ эмпирических данных». Определение термина «анализ данных» не приводится, однако представление о его смысловом содержании можно получить из перечисления стадий анализа данных и их последовательности (табл. 1.1).

Таблица 1.1

Последовательность стадий анализа данных

Стадии анализа данных Исследовательская задача стадии анализа Основные приемы анализа
1 Выявление аномалий, ошибок и пропусков в исходных данных, коррекция выборки, описание простых распределений Качественное осмысление сгруппированных данных; использование приемов описательной статистики, расчет средних тенденций, вариации, параметров
2 Уплотнение исходной информации и ее описание в зарегистрированных показателях с тем, чтобы избавиться от излишней детализации, избежать ошибок последующего анализа вследствие «провалов» в исходных распределениях, повысить уровень обобщения Приемы укрупнения исходных шкал, логические комбинации частных признаков, построение индексов, эмпирическая и теоретическая типологизация, факторный анализ
3 Выявление прямых и косвенных связей, интерпретация и объяснение основных зависимостей и свойств изучаемых явлений, проверка главных и второстепенных гипотез исследования Построение двумерных, многомерных таблиц, расчет корреляций, регрессий, энтропии и ассоциации распределений, использование корреляционных графов, детерминационных моделей
4 Прогноз изучаемых процессов и явлений на основе объяснительных гипотез Приемы мысленного и, если возможно, натурного экспериментирования, повторные и сравнительные исследования, контрольные опросы экспертов для проверки итоговых выводов, моделирование динамических процессов

Эта последовательность отражает цикл качественно-количественного анализа эмпирических данных исследований социальных процессов и явлений, начиная от первичной статистической обработки и «ремонта» выборки до последнего шага — социального прогноза.

Первая стадия — описание всей совокупности данных — в математической статистике носит название «описательная (дескриптивная) статистика». На этой стадии осуществляется общий контроль качества информации: выявляются ошибки и пропуски, допущенные при сборе данных и их вводе в ЭВМ для дальнейшей обработки и анализа, производится коррекция выборки: бракуются элементы выборочной совокупности, не отвечающие модели выборки и т.п. Затем аппарат дескриптивной статистики используется для упорядочения всех данных по отдельным признакам, изучаются простые (линейные) распределения, выявляются т.н. «выбросы», определяются числовые статистические характеристики (показатели средней тенденции, вариабельности, показатели характера распределения).

Основная цель первой стадии анализа эмпирических данных — общая оценка выборочной совокупности и ее подмножеств (частных подвыборок) с тем, чтобы понять, каким образом особенности выборок будут сказываться на интерпретации того или иного частного вывода и обобщающих заключений. Результаты этого этапа необходимо иметь в виду во всех последующих операциях с данными.

Вторая стадия анализа данных — «уплотнение» исходной информации, под которой понимается укрупнение шкал, формирование агрегированных признаков-индексов, выявление типических групп и т.п. Основная цель при этом — сокращение числа признаков, необходимых для итогового анализа, попутно достигается первичное обобщение данных. Вторая стадия «перекликается» с третьей стадией анализа эмпирических данных, поскольку при уплотнении исходной информации могут быть использованы «сильные» методы многофакторного статистического анализа (факторный, кластерный), специфические приемы типологизации.

Особое значение имеет формирование сводных, агрегатных признаков. При этом исследователь не только «уходит» от малосущественных частностей, но и повышает уровень обобщений, что приводит к более емким теоретическим умозаключениям. На этом этапе выполняются необходимые промежуточные истолкования агрегируемых показателей, строятся интерпретационные схемы.

Третья стадия анализа как бы вклинивается в предыдущую. Ее сущность — углубление интерпретации и переход к объяснению социальных фактов путем выявления возможных прямых и косвенных влияний на агрегированные свойства, социальные типы, устойчивые образования. На этой, вероятно самой ответственной, стадии анализа данных должны быть получены основные выводы, получены главные гипотезы, необходимые для разработки практических рекомендаций и для теоретического осмысления проблемы.

Заключительная четвертая стадия— попытка прогноза развития изучаемого процесса, событий, явлений при определенных условиях. Лучшим образом решению этой задачи отвечает повторное обследование. При невозможности его осуществить и для оперативности прогноза используют модели мысленного экспериментирования, регрессионные, детерминационные, стохастические и др.

Итак, на всех этапах анализа данных в управлении мы сталкиваемся с необходимостью применения приемов и методов статистической обработки: в самом начале — методов дескриптивной статистики, затем, вплоть до заключительной стадии, более сложных методов, в основном, многомерного статистического анализа — корреляционного, факторного, кластерного, регрессионного.

 


Дата добавления: 2018-04-15; просмотров: 147; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!