Пример пошаговой множественной регрессии: взаимосвязь психического и биологического
Урок 6. Методы, использующие обучающую информацию
Группа методов анализа данных «с учителем» использует дополнительную информацию, которую несет так называемый «внешний критерий». Этот критерий может быть представлен номинальным, ранговым или количественным показателем, привязанным к объектам анализируемой таблицы данных. Привязка номинального показателя означает разбиение исследуемых объектов на классы (группы). Ранговый показатель задает на множестве объектов отношение порядка. В случае количественного показателя отношения между объектами выражаются в какой‑либо количественной шкале /Пфанцагль И., 1976/. Указанный показатель будет в дальнейшем обозначаться «z».
Множественный регрессионный анализ
В регрессионном анализе критериальный показатель z рассматривается как «зависимая» переменная (как правило, ранговая или количественная), которая выражается функцией от «независимых» признаков x1, … , xp . Линейная функция множественной регрессии записывается следующим образом
w0 называется свободным членом, а элементы весового вектора w = (w1, … , wp)T называются коэффициентами регрессии.
Для оценки эффективности регрессионного уравнения вводится вектор остатков который отражает влияние на z совокупности неучтенных случайных факторов либо меру достижимой аппроксимации значений zi .
Различают два подхода к определению параметров уравнения множественной регрессии в зависимости от происхождения матрицы данных. В первом считается, что признаки детерминированы и случайной величиной является только зависимая переменная z. Этот подход используется наиболее часто. Во втором подходе полагается, что и независимые признаки xj и z — случайные величины, имеющие совместное распределение. В такой ситуации оценка уравнения регрессии есть оценка условного математического ожидания случайной величины z в зависимости от случайных величин xj.
|
|
Каждый из приведенных подходов имеет свои особенности. Вместе с тем, показано, что они отличаются только статистическими свойствами оценок параметров уравнения регрессии, тогда как вычислительные аспекты этих моделей совпадают /Демиденко Е. З., 1981/.
В уравнении множественной регрессии обычно полагают, что величины независимы и случайно распределены с нулевым средним и дисперсией а оценка параметров w0 и w производится с помощью метода наименьших квадратов (МНК). Ищется минимум суммы квадратов невязок
Это приводит к нормальной системе уравнений со следующим решением:
где czx — вектор оценок ковариации между внешним критерием z и признаками x1, … , xp ; mz — оценка среднего значения z ; mx и S — вектор средних значений и матрица ковариаций признаков x1, … , xp .
|
|
Основным показателем качества уравнения множественной регрессии является коэффициент детерминации (квадрат коэффициента множественной корреляции)
— оценка дисперсии прогнозируемой переменной
Статистический смысл коэффициента детерминации заключается в том, что он показывает, какая доля дисперсии зависимой переменной z объясняется построенной функцией регрессии. Например, при коэффициенте детерминации 0,49 регрессионная модель объясняет 49 % дисперсии внешнего критерия, остальные же 51 % считаются обусловленными факторами, не отраженными в регрессионное уравнение.
Еще одним важным показателем качества уравнения множественной регрессии является статистика
С помощью этой статистики проверяется гипотеза H0 : w1 = w2 = … = wp = 0, то есть гипотеза о том, что совокупность признаков x1, … , xp не улучшает описания критериального показателя по сравнению с тривиальным описанием zi = mz . Если F > fp, N –p – 1 , где fp, N –p – 1 — случайная величина, имеющая F‑распределение с p и N – p – 1 степенями свободы, то H0 отклоняется (критерий Фишера).
Ниже приведено уравнение множественной регрессии, связывающее себестоимость продукции на 10 отечественных предприятиях (зависимая переменная) с валовым объемом и производительностью труда (независимые переменные — предикторы):
|
|
себестоимость = 0,8×(валовой объем) + 0,3×(производительность труда)
По статистическим критериям доверие к выявленной зависимости более 99 %. Вместе с тем, часто для иллюстрации полученного уравнения множественной регрессии используют график «наблюдения—предсказания» (Рис. 6. 1):
Рис. 6. 1. Иллюстрация полученной модели множественной регрессии
При большем, чем в рассмотренном примере, числе переменных нередко приходится решать задачу отбора таких переменных в уравнение множественной регрессии. При этом наиболее популярными являются три алгоритма отбора: последовательного увеличения, последовательного уменьшения и алгоритм плюс l минус r, поочередно «работающего» то на добавление, то на удаление переменных. Все алгоритмы являются эвристическими и не гарантируют сходимости к оптимальному решению. Поэтому на практике попытки приблизиться к желаемому оптимуму всегда сопряжены с комбинированным применением указанных алгоритмов.
Пример пошаговой множественной регрессии: взаимосвязь психического и биологического
|
|
Пошаговая множественная регрессия применяется для минимизации количества независимых переменных, входящих в исследуемую модель. Известно много подходов к такой минимизации. В Базовой Системе STATGRAPHICS Plus for Windows реализованы две наиболее популярные процедуры: последовательное увеличение и последовательное уменьшение группы независимых переменных.
Рассматриваемый пример относится к одной из наиболее важных и интересных проблем современных научных исследований.
Соотношение сознания и вещественного мира — одна из ключевых проблем современной науки. Представление о Вселенной как гигантской супермашине, собранной из бесчисленных отдельных объектов и существующих независимо от наблюдателя, отошло в прошлое. Новые модели Вселенной предполагают, что связующим принципом в космической сети выступает сознание — первичный атрибут существования. Ряд известных физиков (Ю. Вигнер, Д. Бом, Дж. Чу, Ф. Капра, А. Янг и др.) высказываются за включение сознания в качестве неотъемлемой и главной части будущей глобальной теории материи.
На фоне эволюции идей о структуре мира биологические и психологические исследования выглядят, может быть, менее масштабно, но не менее весомо. Их основные темы концентрируются около фундаментальной задачи изучения взаимосвязей различных уровней биоорганизации: ген — клетка — организм — психика. Раскрытие данных взаимосвязей, кроме локальных целей, призвано в конечном счете дать ответ на вопрос о биологической обусловленности психики и о свободе воли как важнейшей составляющей индивидуального сознания.
Известно много достижений, например, психофизиологии, описывающей связи физиологических процессов в организме с проявлениями психического, нейропсихологии (о зависимостях между особенностями функционирования нейронных ансамблей и психическими свойствами), генетической психологии (о наследовании различных черт характера, темперамента, психических заболеваний) и др. Вместе с тем накопленные сведения основаны на различных теоретических базах, экспериментальных технологиях, описаны на разных научных языках и пока не поддаются междисциплинарному обобщению, не говоря уже об интеграции с современными космологическими теориями.
Всеобщие законы подобия между предметами и явлениями умели находить восточные мыслители. Их философские концепции, ориентированные на модель «Человек во Вселенной», легли в основу теоретических и практических положений медицины, которые были изложены в многочисленных трактатах (например, китайские «Ней‑цзин», «Хуай нань‑цзы», тибетский медицинский трактат «Жуд‑Ши» и др.). В этих трудах отмечается, что организм человека нужно рассматривать как единое целое, и между работой сердца, центральной нервной системой и внутренними органами человека существует тесная связь. Говорится о влиянии внутренних органов человека на его нравственные черты и описываются связи между некоторыми психическими свойствами и состоянием внутренних органов.
Таким образом, на качественном уровне связи элементов организма человека с его психическими свойствами были известны уже давно. Однако количественное выражение подобных связей стало возможным лишь в наши дни, благодаря соединению ряда обстоятельств.
Во‑первых, к ним относится модернизация восточных знаний по акупунктурной диагностике организма человека и развитие технических средств измерений в биологически активных точках (БАТ), в частности средств электропунктурной диагностики. Во‑вторых, важным обстоятельством является современный уровень психодиагностических тестов, позволяющий с достаточно высокой точностью и надежностью проводить психологические измерения. И, в‑третьих, извлечение закономерностей из результатов электропунктурных и психологических измерений стало возможным на основе развитой технологии компьютерного многомерного анализа данных.
Направление исследований взаимосвязей соматического профиля человека, определяемого методами электропунктурной диагностики, с его психологическими характеристиками получило название электропунктурной психодиагностики. Ниже приводятся сведения об одном из последних экспериментов в этой области.
Испытуемыми были студенты (мужского пола, возраст 20—22 года) Санкт‑Петербургского Государственного Технического Университета. У каждого из них проводилось измерение электрокожного сопротивления с помощью автоматизированного комплекса рефлексотерапевта «АКРО» в 24 биологически активных точках (12 слева и 12 справа), являющихся проекциями отдельных органов (Табл. 6. 1). Кроме того, каждый студент тестировался по психологической методике Шмишека‑Мюллера, диагностирующей 10 акцентуаций характера (Табл. 6. 2).
Таблица 6. 1. Наименование и обозначение репрезентативных точек
обозначения | канал | точка |
P | легкие | 9‑I тай‑юань |
GI | толстый кишечник | 5‑II ян‑си |
E | желудок | 42‑III чун‑ян |
RP | селезенка | 3‑IV тай‑бай |
C | сердце | 7‑V шэнь‑мэнь |
IG | тонкий кишечник | 4‑VI вань‑гу |
V | мочевой пузырь | 65‑VII шу‑гу |
R | почки | 3‑VIII тай‑си |
MC | перикард | 7‑IX да‑лин |
TR | тройной обогреватель | 4‑Х ян‑чи |
VB | желчный пузырь | 40‑ХI цю‑сюй |
F | печень | 3‑ХII тай‑чун |
Таблица 6. 2. Диагностируемые психологические свойства
№ | Название акцентуации | Краткая характеристика |
1 | Гипертимность | активность, энергичность, оптимистичность, с высоким жизненным тонусом |
2 | Застревание | длительное переживание одних и те же чувств, упрямость, сопротивление изменениям |
3 | Эмотивность | богатство эмоциональных реакций, изменчивость настроения |
4 | Педантичность | приверженность к определенному порядку, плохое переключение на новое в деятельности |
5 | Тревожность | ощущение неблагополучия, внутренней напряженности. |
6 | Циклотимность | периоды ровного настроения чередуются с подъемами и субдепрессивными фазами |
7 | Демонстративность | эгоцентричность, стремление постоянно быть в центре внимания |
8 | Возбудимость | агрессивность, упрямство, самолюбие, обидчивость |
9 | Дистимность | частые и длительные изменения настроения в сторону его снижения |
10 | Экзальтированность | склонность приходить в состояние восторженного возбуждения по незначительным поводам и впадать в отчаяние под влиянием разочарования |
Ввод и преобразование данных
Откроем окно таблицы данных и введем следующие результаты измерений электрокожного сопротивления в биологически активных точках (табл. 6. 3) у 14 студентов.
Таблица 6. 3. Результаты измерений электрокожного сопротивления в биологически активных точках справа (x — фоновые, y — после нагрузки)
x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | x10 | x11 | x12 | |
1 | 80 | 107 | 44 | 87 | 85 | 214 | 47 | 91 | 69 | 77 | 54 | 86 |
2 | 94 | 93 | 72 | 106 | 130 | 254 | 75 | 97 | 130 | 69 | 99 | 76 |
3 | 95 | 115 | 81 | 186 | 73 | 79 | 95 | 111 | 96 | 129 | 114 | 110 |
4 | 99 | 126 | 87 | 74 | 69 | 107 | 61 | 121 | 65 | 176 | 85 | 78 |
5 | 117 | 53 | 94 | 122 | 139 | 113 | 101 | 144 | 108 | 59 | 127 | 148 |
6 | 78 | 80 | 58 | 112 | 66 | 195 | 96 | 94 | 86 | 79 | 144 | 142 |
7 | 91 | 95 | 120 | 82 | 131 | 142 | 62 | 140 | 106 | 50 | 76 | 116 |
8 | 104 | 52 | 45 | 113 | 136 | 385 | 65 | 53 | 114 | 180 | 82 | 84 |
9 | 55 | 54 | 65 | 140 | 77 | 173 | 117 | 117 | 82 | 100 | 90 | 107 |
10 | 130 | 109 | 51 | 34 | 129 | 302 | 37 | 126 | 123 | 126 | 60 | 62 |
11 | 64 | 66 | 70 | 186 | 61 | 204 | 157 | 129 | 66 | 86 | 99 | 69 |
12 | 81 | 82 | 94 | 167 | 78 | 112 | 153 | 130 | 85 | 75 | 138 | 149 |
13 | 58 | 144 | 49 | 53 | 53 | 289 | 55 | 115 | 82 | 135 | 105 | 81 |
14 | 91 | 144 | 49 | 49 | 82 | 293 | 64 | 88 | 113 | 124 | 90 | 60 |
y1 | y2 | y3 | y4 | y5 | y6 | y7 | y8 | y9 | y10 | y11 | y12 |
113 | 115 | 67 | 163 | 88 | 293 | 96 | 98 | 94 | 93 | 79 | 58 |
124 | 75 | 76 | 152 | 86 | 125 | 108 | 139 | 133 | 60 | 101 | 62 |
122 | 107 | 77 | 191 | 91 | 101 | 96 | 142 | 99 | 123 | 116 | 147 |
124 | 78 | 75 | 105 | 82 | 121 | 89 | 83 | 78 | 171 | 82 | 97 |
112 | 84 | 92 | 131 | 124 | 154 | 91 | 139 | 97 | 100 | 116 | 120 |
87 | 58 | 90 | 221 | 60 | 137 | 127 | 227 | 109 | 79 | 159 | 119 |
97 | 74 | 88 | 94 | 113 | 191 | 61 | 125 | 111 | 95 | 85 | 75 |
111 | 43 | 84 | 116 | 88 | 284 | 91 | 70 | 108 | 147 | 124 | 71 |
70 | 100 | 63 | 132 | 99 | 209 | 104 | 141 | 91 | 130 | 79 | 97 |
123 | 74 | 67 | 74 | 66 | 194 | 61 | 115 | 118 | 106 | 100 | 81 |
76 | 76 | 42 | 231 | 62 | 156 | 140 | 130 | 72 | 79 | 117 | 66 |
75 | 59 | 96 | 170 | 86 | 94 | 119 | 119 | 89 | 63 | 126 | 116 |
69 | 115 | 77 | 72 | 48 | 274 | 89 | 100 | 67 | 146 | 99 | 74 |
80 | 83 | 66 | 56 | 70 | 235 | 70 | 88 | 117 | 107 | 89 | 71 |
Введем в эту же таблицу данные психологического тестирования.
Результаты тестирования (Z — акцентуации)
z1 | z2 | z3 | z4 | z5 | z6 | z7 | z8 | z9 | z10 | |
1 | 18 | 18 | 12 | 12 | 3 | 6 | 10 | 0 | 9 | 12 |
2 | 12 | 12 | 21 | 22 | 6 | 6 | 10 | 15 | 9 | 12 |
3 | 12 | 8 | 3 | 10 | 3 | 12 | 8 | 6 | 6 | 12 |
4 | 12 | 20 | 12 | 14 | 18 | 9 | 12 | 15 | 6 | 12 |
5 | 9 | 18 | 18 | 12 | 0 | 12 | 16 | 6 | 15 | 12 |
6 | 24 | 12 | 21 | 16 | 9 | 12 | 18 | 9 | 9 | 12 |
7 | 21 | 6 | 12 | 18 | 12 | 15 | 10 | 6 | 12 | 6 |
8 | 6 | 4 | 6 | 10 | 3 | 9 | 14 | 9 | 9 | 6 |
9 | 18 | 12 | 0 | 4 | 0 | 6 | 20 | 3 | 6 | 12 |
10 | 15 | 10 | 12 | 12 | 3 | 12 | 10 | 12 | 15 | 6 |
11 | 15 | 14 | 24 | 6 | 3 | 15 | 20 | 21 | 6 | 12 |
12 | 21 | 12 | 9 | 10 | 0 | 6 | 18 | 3 | 3 | 12 |
13 | 24 | 12 | 15 | 12 | 15 | 12 | 20 | 12 | 9 | 12 |
14 | 12 | 12 | 3 | 14 | 2 | 9 | 8 | 12 | 15 | 6 |
Как уже отмечалось, удалось построить статистически значимые регрессионные модели практически для всех акцентуаций характера. При этом в модели входили результаты измерения ЭКС как фоновые, так и после нагрузки. В то же время значительный интерес представляют собой новые переменные, представляющие собой отношения фона к нагрузке. Для создания таких переменных произведем следующие операции.
Выделим новую колонку в таблице данных и щелкнем правой кнопкой мыши. В появившемся меню выберем Generate Data. В поле Expression диалогового окна Generate Data введем требуемое преобразование — отношение фонового замера к измерению после нагрузки (Рис. 6. 2). Нажмем OK.
Выберем в контекстном меню команду Modify Column. Зададим в поле Name имя новой переменной rr1. В поле Comment запишем комментарий «отношение фона к нагрузке» (Рис. 6. 3). Нажмем кнопку OK. Аналогичным образом сгенерируем остальные переменные rr2 — rr12.
Рис. 6. 2. Окно диалога для генерации новых переменных
Рис. 6. 3. Окно для наименования переменных, задания их типа и ввода комментариев
Дата добавления: 2021-03-18; просмотров: 66; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!