Применение корреляционного анализа для установления структуры обобщенных индексов

Лекция 4. Применение программ анализа данных для решения задач управления

План лекции

1. Выбор информативных показателей средствами описательной статистики

2. Применение корреляционного анализа для установления структуры обобщенных индексов

3. Снижение размерности представления данных методами факторного анализа

4. Выявление структуры многомерных данных методами кластерного анализа

5. Решение задач классификации методами дискриминантного анализа

6. Моделирование социально-экономических явлений методами множественного линейного регрессионного анализа

7. Свертка информативных показателей в комплексный критерий на основе функции желательности Харрингтона

8. Решение задач прогнозирования и управления с помощью экспертно-аналитической системы Expert Decide

 

    Вопросы применения как статистических программ, так и экспертно-аналитических систем для анализа объективных и субъективных (экспертных) данных в управлении слишком разнообразны, чтобы их можно было рассмотреть в одной лекции. В то же время представляется полезным продемонстрировать на характерных примерах возможности, которые предоставляет их использование в типичных управленческих ситуациях. Ниже приводятся некоторые примеры, являющиеся результатом работ в области анализа данных, выполненных автором в Лаборатории социальных исследований Гуманитарного факультета Орловского государственного технического университета, на кафедре управления инновациями и инвестиционной деятельностью Государственной академии профессиональной переподготовки и повышения квалификации руководящих работников и специалистов инвестиционной сферы, а также на кафедре математики и математических методов в управлении Орловской региональной академии государственной службы.

Выбор информативных показателей средствами описательной статистики

 

Одной из важнейших социальных категорий в управлении является уровень жизни. Общепринята точка зрения, что комплексное исследование уровня жизни возможно с помощью системы статистических показателей. Таковой, в частности, является система «Основные показатели уровня жизни населения в условиях рыночной экономики», разработанная в Центре экономической конъюнктуры и прогнозирования при Министерстве экономики РФ в 1992 г. и охватывающая 39 показателей, из которых 12 наиболее важных включены в Систему показателей для оценки хода экономических реформ в России. Указанная система рекомендована органам исполнительной власти регионов-субъектов РФ для использования в анализе хода экономических реформ на соответствующих территориях. Помимо понятия «уровень жизни», в социальной статистике рассматривается также понятие «качество жизни», определяемое по совокупности показателей жизнедеятельности населения, содержащихся в разделах «Уровень жизни населения», «Население», «Труд», «Здравоохранение», «Образование» и т.д.

Проблема разработки обобщающего (интегрального) показателя уровня жизни с точки зрения анализа данных имеет две стороны:

1) отбор множества показателей, адекватно отражающих уровень жизни на каждом иерархическом уровне анализа;

2) математические аспекты вычисления частных индикаторов уровня и их агрегирования в интегральный показатель.

Актуальной является задача выбора множества информативных показателей качества жизни, комплексный анализ которых способствует более полному представлению о качестве жизни населения в регионе.

В рамках работ по гранту РФФИ (проект № 03-06-96412 «Разработка комплексного регионального индекса для сравнительного анализа качества жизни в регионах Центральной России») выполнен отбор показателей официальной статистики, характеризующих различные аспекты качества жизни в регионе (табл. 3.1).

Таблица 3.1

Структура интегрального регионального показателя уровня жизни

 

Аспект качества жизни Статистические показатели

Уровень здоровьянаселения

Коэффициент естественного прироста населения
Ожидаемая продолжительность жизни при рождении

Уровень интеллектуального потенциаларегиона

Суммарное число посещений музеев и театров на 1000 населения
Число студентов на 1000 населения

Уровень благосостояния населения

ВРП на душу населения
Фактическое потребление на душу населения

Уровень социальной напряженности в регионе

Удельный вес населения с денежными доходами меньше величины прожиточного минимума в общей численности населения
Общая безработица, % к экономически активному населению Численность незанятых граждан, зарегистрированных в органах государственной службы занятости, в расчете на одну заявленную вакансию
Суммарное число убийств и покушений на убийство и причинения тяжкого вреда здоровью человека на 100000 населения

Представление о степени информативности показателей дают статистические характеристики, рассчитанные по данным 1998 года средствами ПСП SPSS Base 8.0 (табл. 3.2).

Таблица 3.2

Статистические характеристики региональных показателей для расчета интегрального регионального индекса уровня жизни

 

 

 

 

 

 

 

 

 

 

 

 

Показатель Минимум Максимум Среднее Стандартное отклонение Коэффициент вариации, %
Суммарное число посещений театров и музеев на 1000 населения
249 931 484 186 38,5
Число студентов на 1000 населения
12,2 26,9 17,2 4,90 28,5
Коэффициент естественного прироста населения, промилле
-11,2 -6,3 -8,8 1,33 15,1
Ожидаемая продолжительность жизни при рождении, лет
65,2 69,3 66,9 1,11 1,7
ВРП на душу населения, руб.
7294 15620 11124 2362 21,2
Фактическое потребление на душу населения, руб.
6296 10692 7951 1094 13,8
Доля бедных, %
19,4 30,6 24,9 3,10 12,5
Уровень безработицы, %
7,1 18,8 12,0 2,80 23,4
Численность незанятых граждан в расчете на одну заявленную вакансию
3,9 64,5 14,2 15,4 108,8
Число тяжких преступлений на 100000 населения
24 57 42,5 9,67 22,8

Более информативными являются показатели, характеризующиеся большими значениями коэффициента вариации V, вычисляемого как отношение стандартного отклонения (СКО) к среднему значению показателя по регионам (без г. Москвы, являющейся в статистическом смысле «выбросом»), выраженного в процентах. К таковым относятся:

1) численность незанятых граждан в расчете на одну заявленную вакансию (V =108,8 %);

2) суммарное число посещений театров и музеев на 1000 населения (V =38,5 %);

3) число студентов на 1000 населения (V =28,5 %);

4) уровень безработицы, % (V =23,4 %);

5) число тяжких преступлений на 100000 населения (V =22,8 %);

6) ВРП на душу населения, руб. (V =21,2 %).

Менее информативны показатели:

7) ожидаемая продолжительность жизни при рождении, лет (V =1,7 %);

8) доля бедных, % (V =12,5 %);

9) фактическое потребление на душу населения, руб. (V =12,5 %);

10) коэффициент естественного прироста населения, промилле (V =15,1 %).

В отношении последнего показателя следует заметить, что поскольку коэффициент естественного прироста населения есть сальдо двух показателей — рождаемости и смертности, к использованию коэффициента вариации следует подходить осторожно. Так, если среднее значение коэффициента естественного прироста населения равно нулю, вычисление коэффициента вариации вообще становится невозможным. Более корректным является анализ вариабельности исходных показателей (рождаемости и смертности).

Значения коэффициента вариации могут быть использованы при назначении весов отдельных показателей при их «свертке» в обобщенные индексы.

Применение корреляционного анализа для установления структуры обобщенных индексов

 

    При установлении структуры обобщенных индексов необходимо учитывать степень коррелированности исходных показателей. В случае сильной положительной корреляции можно использовать простое или взвешенное арифметическое усреднение безразмерных индексов, соответствующих частным показателям. Если корреляция показателей слабая, то усреднение следует проводить по формулам геометрического среднего, либо использовать иные способы свертки исходных показателей.

Приведем два характерных примера из работы по установлению структуры комплексного регионального индекса с целью анализа качества жизни в регионах Центральной России. Был использован наиболее простой способ перехода от размерных исходных показателей к частным индексам — нормирование на величину размаха показателя по формуле

Частный индекс = (ХXmin)/( XmaxXmin),            (4.1)

где Х — значение соответствующего информативного показателя для региона; Xmax и Xmin — максимальное и минимальное значения показателя по массиву региональных данных. При таком нормировании частный индекс принимает значения от 0 (для региона с минимальным значением показателя) до 1 (для региона с максимальным значением показателя).

1. Индекс благосостояния определяли как среднее арифметическое двух частных индексов — индекса ВРП и индекса потребления. Между этими индексами наблюдается статистически значимая положительная корреляция с коэффициентом линейной корреляции Пирсона r = 0,810, что является основанием для их усреднения (см. также рис. 4.1).

2. Иная ситуация возникает в случае анализа двух показателей напряженности на рынке труда: уровня общей безработицы и численностью незанятых граждан в расчете на одну заявленную вакансию. Эти две показателя отражают две стороны безработицы. Первый — уровень безработицы — обусловлен социально-экономической ситуацией в целом в стране и в регионе, второй — численность незанятых граждан в расчете на одну заявленную вакансию — показатель, часто также называемый коэффициентом напряженности на рынке труда, в большей мере характеризует деятельность региональных служб занятости.

 

Рис. 4.1. Распределение составляющих индекса благосостояния по регионам ЦФО

 

Действительно, из анализа диаграммы рассеяния этих двух показателей (рис. 4.2 а) следует наличие трех групп регионов. В первую группу входят большинство регионов с коэффициентом напряженности на рынке труда менее 12,1 незанятых граждан в расчете на одну заявленную вакансию, три региона — Тамбовская, Владимирская и Брянская области — характеризуются высокими значения этого показателя (от 26,5 до 29,6), и особо выделяется Ивановская область с экстремально высокой численностью незанятых граждан в расчете на одну заявленную вакансию — 64,5 человек. Наблюдаемая положительная корреляция между двумя показателями напряженности на рынке труда, по сути, относится к классу «псевдокорреляций», поскольку соответствующее высокое значение коэффициента линейной корреляции Пирсона r=0,716 определено по неоднородной выборке. При «очистке» выборки от выбросов коэффициент линейной корреляции принял близкое к нулю значение 0,054 (рис. 4.2 б), что обусловило поиск специфического вида объединения показателей напряженности на рынке труда.


Дата добавления: 2018-04-15; просмотров: 174; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!