Глава 5. «Разрыв поколений» или ещё немного о росте.
Санкт-Петербургский государственный политехнический университет
Институт физики, нанотехнологий и телекоммуникаций
Проектная работа: «Статистика жизни»
Выполнили студенты ИФНиТа:
Кондратьев А.С. (23431/4)
Ананьева А.Д. (23431/4)
Брасс А.А. (23431/1)
Ларионов В.Е. (23431/4)
Салманов В.Х. (23431/4)
Тихонова Т.А. (23431/4)
Шаврин А.А. (23431/2)
Шишканова Ю.П. (23431/4)
Санкт-Петербург
2018
Оглавление:
Глава 1
Связь между цветом глаз и цветом волос ……………………………………...3
Глава 2
Среда заела …………………………………………………………………….. 5
Глава 3
Что сложнее? …………………………………………………………………….. 6
Глава 4
Яблоко от яблони ……...……………………………………………………….. 10
Глава 5
«Разрыв поколений» или ещё немного о росте...…………………………….. 23
Глава 6
Всё, что я говорю, будет на ЕГЭ………………..…………………………….. 25
Литература ….……………………………………………………………….. 28
Глава 1. Связь между цветом глаз и цветом волос
Чтобы определить, есть ли связь между цветом глаз и цветом волос, для начала нужно собрать данные. Составленный нами опрос дал следующие результаты:
глаза/волосы | Блондин | Брюнет | Каштановый | Русый | Рыжий | Всего |
Голубые | 4 | 3 | 7 | 78 | 3 | 95 |
Зелёные | 4 | 11 | 14 | 52 | 4 | 85 |
Карие | 2 | 38 | 23 | 48 | 2 | 113 |
Всего | 10 | 52 | 44 | 178 | 9 | 293 |
Таблица 1.1. Количество опрошенных с соответствующим цветом глаз и волос.
|
|
Несмотря на то, что цвет - это качественный признак, к нему можно применить методы статистики. Существует критерий под названием «Хи-квадрат», который поможет сделать вывод о том, существует ли связь между цветом глаз и цветом волос.
Формулируем нулевую гипотезу: связи между цветом глаз и цветом волос нет. Это значит, что вероятность иметь глаза, например, голубого цвета у блондина такая же, как у всех остальных.
Если связи нет, то мы можем построить таблицу ожидаемых значений. То есть наиболее вероятные результаты опроса, если бы нулевая гипотеза оказалась бы верна.
глаза/волосы | Блондин | Брюнет | Каштановый | Русый | Рыжий | Всего |
Голубые | 3,24 | 16,86 | 14,27 | 57,71 | 2,92 | 95 |
Зелёные | 2,90 | 15,09 | 12,76 | 51,64 | 2,61 | 85 |
Карие | 3,86 | 20,05 | 16,97 | 68,65 | 3,47 | 113 |
Всего | 10 | 52 | 44 | 178 | 9 | 293 |
Таблица 1.2. Ожидаемые результаты опроса.
Рассчитываем значение критерия:
Теперь, чтобы сделать вывод, надо сравнить это значение с критическим из таблицы:
k/α | 0,05 | 0,01 | 0,001 |
1 | 3,841 | 6,635 | 10,827 |
2 | 5,991 | 9,21 | 13,815 |
3 | 7,815 | 11,341 | 16,268 |
4 | 9,488 | 13,277 | 18,465 |
5 | 11,07 | 15,086 | 20,517 |
6 | 12,592 | 16,812 | 22,457 |
7 | 14,067 | 18,475 | 24,322 |
8 | 15,507 | 20,09 | 26,125 |
9 | 16,919 | 21,666 | 27,877 |
10 | 18,307 | 23,209 | 29,588 |
11 | 19,675 | 24,725 | 31,264 |
12 | 21,026 | 26,217 | 32,909 |
13 | 22,362 | 27,688 | 34,528 |
14 | 23,685 | 29,141 | 36,123 |
15 | 24,996 | 30,578 | 37,697 |
Таблица 1.3.Таблица критических значений критерия Хи-квадрат.
|
|
Проанализируем полученные результаты. Нулевая гипотеза отвергается, то есть, связь между цветом глаз и цветом волос есть. В частности, вероятнее, что карие глаза будут у брюнета, чем у блондина. α - уровень значимости. Нулевая гипотеза будет отвергаться даже для уровня значимости α=0,001. Это означает, что если десять тысяч раз провести подобный опрос, то нулевая гипотеза будет подтверждена меньше, чем в одном из них.
Полученный результат может быть толчком к новому исследованию в биологии. Если цвет глаз и волос связаны, то в чём причина этой связи?
Замечания: чтобы применить критерий «Хи-квадрат» рекомендуется, чтобы в таблице сопряженности (Таблица 1.1) в каждой ячейке стояла число больше 5. Несмотря на то, что данная рекомендация у нас не выполнена, полученный вывод можно считать достоверным, потому что критическое значение критерия оказалось НАМНОГО меньше экспериментального.
Глава 2. Среда заела
В этой главе проверим, влияет ли место жительства на успеваемость в учёбе. Если, например, окажется, что студенты из общежитий успевают хуже местных, то в интересах Политехнического университета будет улучшить условия жизни в общежитиях, ведь они могут потерять хороших студентов. Интересы же студентов в этом вопросе очевидны. Таким образом, результаты этого анализа будут весьма полезны.
|
|
Для анализа применим критерий Пирсона (Хи-квадрат). Он уже был рассмотрен в главе 1, поэтому не будем расписывать его так подробно.
Результаты проведенного нами опроса среди студентов второго курса направления «физика»:
Балл за третий семестр >23,6 | Балл за третий семестр <23,6 | Всего | |
Живут в общежитии | 6 | 7 | 13 |
Не живут в общежитии | 14 | 11 | 25 |
Всего | 20 | 18 | 38 |
Таблица 2.1. Наблюдаемые величины распределения студентов по баллам в зависимости от места жительства.
Формулируем нулевую гипотезу: место жительства не влияет на успеваемость.
Строим таблицу ожидаемых величин:
Балл за третий семестр >23,6 | Балл за третий семестр <23,6 | Всего | |
Живут в общежитии | 6,84 | 6,16 | 13 |
Не живут в общежитии | 13,16 | 11,84 | 25 |
Всего | 20 | 18 | 38 |
Таблица 2.2.Ожидаемые величины распределения студентов по баллам в зависимости от места жительства, если верна нулевая гипотеза.
|
|
Таким образом, нулевая гипотеза принимается, и студенты из общежитий учатся так же успешно(неуспешно), как местные. Однако это ещё не значит, что нет разницы между жизнью в общежитии и в квартире. Вероятно, различие будет в других сферах деятельности, так что нужны дополнительные исследования, чтобы найти аргументы для улучшения уровня жизни в общежитиях.
Глава 3. Что сложнее?
В целях повышения успеваемости студентов дирекция ИФНиТа может попробовать на сессии оставлять как можно больше времени на подготовку к сложным предметам. Но как определить, какой предмет сложнее, то есть, какой предмет в среднем сдают хуже? Конечно, можно посмотреть на известные результаты экзаменов по разным предметам. Но разве тот, который сдают лучше, будет всегда легче? Нет, разумеется. Если, например, два экзамена одинаковы по сложности, то иногда первый сдавать будут лучше другого, а иногда наоборот. И в данном случае ошибка в определении более сложного экзамена пойдёт только во вред успеваемости студентов.
Чтобы достоверно определить, какой экзамен сложнее, воспользуемся критерием Стьюдента. Здесь и далее везде подразумеваем, что преподаватели и экзаменаторы для каждого предмета одни и те же. То есть мы не можем говорить о сложности экзамена, если его принимают разные преподаватели. Покажем, как это сделать. Определим, достоверна ли разница в средних оценках за экзамены в третьем семестре у групп направления «физика» по математическому анализу и физике.
Надо отметить, что для применения критерия Стьюдента, как и критерия «Хи-квадрат», необходимо, чтобы наблюдаемое распределение случайной величины было близко к нормальному. Очевидно, это условие выполнено, как в этой главе, так и в предыдущих главах.
Результаты проведенного нами опроса:
№ | Мат. анализ | Физика |
1 | 2 | 3 |
2 | 2 | 4 |
3 | 2 | 3 |
4 | 2 | 3 |
5 | 2 | 2 |
6 | 2 | 3 |
7 | 2 | 3 |
8 | 2 | 4 |
9 | 3 | 5 |
10 | 3 | 4 |
11 | 3 | 5 |
12 | 3 | 3 |
13 | 3 | 4 |
14 | 3 | 4 |
15 | 3 | 5 |
16 | 3 | 3 |
17 | 3 | 4 |
18 | 3 | 5 |
19 | 3 | 5 |
20 | 3 | 5 |
21 | 4 | 3 |
22 | 4 | 5 |
23 | 4 | 4 |
24 | 4 | 4 |
25 | 4 | 3 |
26 | 4 | 4 |
27 | 4 | 4 |
28 | 4 | 4 |
29 | 4 | 5 |
30 | 4 | 4 |
31 | 4 | 4 |
32 | 4 | 5 |
33 | 4 | 5 |
34 | 4 | 5 |
35 | 5 | 5 |
36 | 5 | 4 |
37 | 5 | 4 |
38 | 5 | 5 |
Таблица 3.1. Результаты студентов направления «физика» за экзамены по математическому анализу и физике в третьем семестре.
Подход такой же, как в первых двух главах: формулируем нулевую гипотезу, ищем экспериментальное значение критерия Стьюдента и сравниваем его с критическим.
Нулевая гипотеза: различие в средних оценках у студентов по физике и математике недостоверно.
Значение критерия Стьюдента находим по следующей формуле:
№ | Мат. анализ (x) | Физика (y) | x-<x> | y-<y> | (x-<x>)^2 | (y-<y>)^2 |
1 | 2 | 3 | -1,37 | -1,05 | 1,87 | 1,11 |
2 | 2 | 4 | -1,37 | -0,05 | 1,87 | 0,00 |
3 | 2 | 3 | -1,37 | -1,05 | 1,87 | 1,11 |
4 | 2 | 3 | -1,37 | -1,05 | 1,87 | 1,11 |
5 | 2 | 2 | -1,37 | -2,05 | 1,87 | 4,21 |
6 | 2 | 3 | -1,37 | -1,05 | 1,87 | 1,11 |
7 | 2 | 3 | -1,37 | -1,05 | 1,87 | 1,11 |
8 | 2 | 4 | -1,37 | -0,05 | 1,87 | 0,00 |
9 | 3 | 5 | -0,37 | 0,95 | 0,14 | 0,90 |
10 | 3 | 4 | -0,37 | -0,05 | 0,14 | 0,00 |
11 | 3 | 5 | -0,37 | 0,95 | 0,14 | 0,90 |
12 | 3 | 3 | -0,37 | -1,05 | 0,14 | 1,11 |
13 | 3 | 4 | -0,37 | -0,05 | 0,14 | 0,00 |
14 | 3 | 4 | -0,37 | -0,05 | 0,14 | 0,00 |
15 | 3 | 5 | -0,37 | 0,95 | 0,14 | 0,90 |
16 | 3 | 3 | -0,37 | -1,05 | 0,14 | 1,11 |
17 | 3 | 4 | -0,37 | -0,05 | 0,14 | 0,00 |
18 | 3 | 5 | -0,37 | 0,95 | 0,14 | 0,90 |
19 | 3 | 5 | -0,37 | 0,95 | 0,14 | 0,90 |
20 | 3 | 5 | -0,37 | 0,95 | 0,14 | 0,90 |
21 | 4 | 3 | 0,63 | -1,05 | 0,40 | 1,11 |
22 | 4 | 5 | 0,63 | 0,95 | 0,40 | 0,90 |
23 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
24 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
25 | 4 | 3 | 0,63 | -1,05 | 0,40 | 1,11 |
26 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
27 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
28 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
29 | 4 | 5 | 0,63 | 0,95 | 0,40 | 0,90 |
30 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
31 | 4 | 4 | 0,63 | -0,05 | 0,40 | 0,00 |
32 | 4 | 5 | 0,63 | 0,95 | 0,40 | 0,90 |
33 | 4 | 5 | 0,63 | 0,95 | 0,40 | 0,90 |
34 | 4 | 5 | 0,63 | 0,95 | 0,40 | 0,90 |
35 | 5 | 5 | 1,63 | 0,95 | 2,66 | 0,90 |
36 | 5 | 4 | 1,63 | -0,05 | 2,66 | 0,00 |
37 | 5 | 4 | 1,63 | -0,05 | 2,66 | 0,00 |
38 | 5 | 5 | 1,63 | 0,95 | 2,66 | 0,90 |
сумма | 128 | 154 | 0,00 | 0,00 | 32,84 | 25,89 |
среднее | 3,37 | 4,05 |
Таблица 3.2. Обработка данных из таблицы 3.1 (под двойкой имеется в виду «неудовлетворительно»).
Подставляем полученные данные в формулу для tэ
k | α=0,05 | α=0,01 | α=0,001 |
1 | 12,7 | 63,65 | 636,61 |
2 | 4,303 | 9,925 | 31,602 |
3 | 3,182 | 5,841 | 12,923 |
4 | 2,776 | 4,604 | 8,610 |
5 | 2,571 | 4,032 | 6,869 |
6 | 2,447 | 3,707 | 5,959 |
7 | 2,365 | 3,499 | 5,408 |
8 | 2,306 | 3,355 | 5,041 |
9 | 2,262 | 3,250 | 4,781 |
10 | 2,228 | 3,169 | 4,587 |
11 | 2,201 | 3,106 | 4,437 |
12 | 2,179 | 3,055 | 4,318 |
13 | 2,16 | 3,012 | 4,221 |
14 | 2,145 | 2,977 | 4,140 |
15 | 2,131 | 2,947 | 4,073 |
16 | 2,12 | 2,921 | 4,015 |
17 | 2,11 | 2,898 | 3,965 |
18 | 2,101 | 2,878 | 3,922 |
19 | 2,093 | 2,861 | 3,883 |
20 | 2,086 | 2,845 | 3,850 |
21 | 2,08 | 2,831 | 3,819 |
22 | 2,074 | 2,819 | 3,792 |
23 | 2,069 | 2,807 | 3,768 |
24 | 2,064 | 2,797 | 3,745 |
25 | 2,06 | 2,787 | 3,725 |
26 | 2,056 | 2,779 | 3,707 |
27 | 2,052 | 2,771 | 3,690 |
28 | 2,049 | 2,763 | 3,674 |
29 | 2,045 | 2,756 | 3,659 |
30 | 2,042 | 2,750 | 3,646 |
31 | 2,04 | 2,744 | 3,633 |
32 | 2,037 | 2,738 | 3,622 |
33 | 2,035 | 2,733 | 3,611 |
34 | 2,032 | 2,728 | 3,601 |
35 | 2,03 | 2,724 | 3,591 |
36 | 2,028 | 2,719 | 3,582 |
37 | 2,026 | 2,715 | 3,574 |
38 | 2,024 | 2,712 | 3,566 |
39 | 2,023 | 2,708 | 3,558 |
40 | 2,021 | 2,704 | 3,551 |
Таблица 3.3. Критические значения критерия Стьюдента.
Сравним с критическим значением:
Таким образом, в среднем студенты сдают физику лучше, чем математический анализ. Значит, стоит оставлять больше времени на подготовку к математическому анализу.
Глава 4. Яблоко от яблони…
В этой главе мы определим, есть ли связь между ростом детей и их родителей. Под ростом детей будем понимать максимальное значение роста, которого они достигнут. Если окажется, что связь есть, можно будет написать уравнения регрессии, которые помогут предсказать наиболее вероятный рост детей, обладая знаниями о росте родителей. Очевидно, на рост влияет не только генетика, но и факторы другого рода, например, питание и физическая активность.
Воспользуемся корреляционным анализом Пирсона. Это параметрический критерий, то есть им можно пользоваться, если распределение случайной величины (роста) подчиняется нормальному закону. В данном случае, очевидно, это условие выполнено.
Итак, применим этот метод. Вначале найдём коэффициент корреляции. Если окажется, что коэффициент корреляции близок к единице, то влияние на рост генетики самое значительное из всех факторов, определяющих рост. И чем ближе коэффициент корреляции к единице, тем больше вклад генетики.
Результаты, проведенного нами опроса (рост везде измеряется в см):
№ | Рост | № | Рост | |||||
Сын | Отец | Мать | Дочь | Отец | Мать | |||
1 | 184 | 178 | 170 | 1 | 172 | 188 | 164 | |
2 | 188 | 182 | 164 | 2 | 162 | 192 | 162 | |
3 | 185 | 182 | 172 | 3 | 160 | 182 | 172 | |
4 | 190 | 189 | 172 | 4 | 158 | 179 | 165 | |
5 | 174 | 170 | 172 | 5 | 166 | 185 | 160 | |
6 | 180 | 170 | 172 | 6 | 177 | 185 | 173 | |
7 | 184 | 183 | 168 | 7 | 178 | 200 | 168 | |
8 | 195 | 190 | 173 | 8 | 175 | 198 | 165 | |
9 | 189 | 174 | 170 | 9 | 173 | 188 | 163 | |
10 | 190 | 185 | 173 | 10 | 166 | 160 | 178 | |
11 | 189 | 192 | 165 | 11 | 160 | 170 | 158 | |
12 | 178 | 163 | 168 | 12 | 160 | 182 | 168 | |
13 | 171 | 174 | 168 | 13 | 172 | 178 | 169 | |
14 | 183 | 169 | 170 | 14 | 162 | 169 | 152 | |
15 | 185 | 188 | 175 | 15 | 168 | 183 | 167 | |
16 | 184 | 182 | 175 | 16 | 159 | 192 | 146 | |
17 | 178 | 170 | 164 | 17 | 158 | 175 | 158 | |
18 | 180 | 178 | 168 | 18 | 173 | 172 | 195 | |
19 | 186 | 186 | 164 | 19 | 165 | 180 | 177 | |
20 | 189 | 183 | 170 | 20 | 165 | 173 | 166 | |
21 | 182 | 178 | 160 | 21 | 166 | 178 | 167 | |
22 | 183 | 180 | 177 | 22 | 169 | 187 | 158 | |
23 | 194 | 180 | 172 | 23 | 172 | 187 | 176 | |
24 | 180 | 178 | 168 | 24 | 160 | 172 | 165 | |
25 | 187 | 178 | 168 | 25 | 173 | 185 | 173 | |
26 | 185 | 180 | 182 | 26 | 161 | 178 | 160 | |
27 | 185 | 191 | 170 | 27 | 168 | 178 | 168 | |
28 | 184 | 176 | 160 | 28 | 174 | 185 | 171 | |
29 | 177 | 172 | 162 | 29 | 185 | 190 | 175 | |
30 | 172 | 177 | 159 | 30 | 165 | 172 | 162 | |
31 | 183 | 178 | 171 | 31 | 175 | 181 | 161 | |
32 | 184 | 177 | 178 | 32 | 170 | 181 | 161 | |
33 | 179 | 176 | 167 | 33 | 164 | 177 | 159 | |
34 | 189 | 182 | 169 | 34 | 181 | 178 | 180 | |
35 | 185 | 180 | 157 | 35 | 174 | 188 | 177 | |
36 | 179 | 180 | 157 | 36 | 160 | 178 | 160 | |
37 | 174 | 180 | 157 | 37 | 177 | 180 | 164 | |
38 | 190 | 182 | 162 | 38 | 162 | 175 | 161 | |
39 | 170 | 178 | 152 | 39 | 164 | 171 | 167 | |
40 | 176 | 181 | 163 | 40 | 168 | 176 | 162 | |
41 | 178 | 175 | 161 | |||||
42 | 179 | 182 | 163 | |||||
Таблица 4.1. Рост сыновей и их родителей. | Таблица 4.2. Рост дочерей и их родителей. |
Параметрический коэффициент корреляции определяется по формуле:
Естественно, нельзя рассчитать коэффициент корреляции сразу для обоих родителей, поэтому для каждого из родителей рассчитаем свой коэффициент корреляции. Заодно можно будет проверить, какой из родителей вносит больший вклад в рост ребенка.
Составим вспомогательные таблицы для нахождения коэффициента корреляции.
№ | Рост | s-<s> | f-<f> | (s-<s>)(f-<f>) | (s-<s>)^2 | (f-<f>)^2 | |
Сын (s) | Отец (f) | ||||||
1 | 184 | 178 | 1,2 | -1,3 | -1,5 | 1,5 | 1,6 |
2 | 188 | 182 | 5,2 | 2,7 | 14,3 | 27,2 | 7,5 |
3 | 185 | 182 | 2,2 | 2,7 | 6,1 | 4,9 | 7,5 |
4 | 190 | 189 | 7,2 | 9,7 | 70,3 | 52,0 | 94,8 |
5 | 174 | 170 | -8,8 | -9,3 | 81,4 | 77,2 | 85,8 |
6 | 180 | 170 | -2,8 | -9,3 | 25,8 | 7,8 | 85,8 |
7 | 184 | 183 | 1,2 | 3,7 | 4,5 | 1,5 | 14,0 |
8 | 195 | 190 | 12,2 | 10,7 | 131,2 | 149,2 | 115,3 |
9 | 189 | 174 | 6,2 | -5,3 | -32,7 | 38,6 | 27,7 |
10 | 190 | 185 | 7,2 | 5,7 | 41,4 | 52,0 | 32,9 |
11 | 189 | 192 | 6,2 | 12,7 | 79,2 | 38,6 | 162,3 |
12 | 178 | 163 | -4,8 | -16,3 | 77,8 | 22,9 | 264,4 |
13 | 171 | 174 | -11,8 | -5,3 | 62,0 | 138,9 | 27,7 |
14 | 183 | 169 | 0,2 | -10,3 | -2,2 | 0,0 | 105,3 |
15 | 185 | 188 | 2,2 | 8,7 | 19,3 | 4,9 | 76,4 |
16 | 184 | 182 | 1,2 | 2,7 | 3,3 | 1,5 | 7,5 |
17 | 178 | 170 | -4,8 | -9,3 | 44,3 | 22,9 | 85,8 |
18 | 180 | 178 | -2,8 | -1,3 | 3,5 | 7,8 | 1,6 |
19 | 186 | 186 | 3,2 | 6,7 | 21,7 | 10,3 | 45,4 |
20 | 189 | 183 | 6,2 | 3,7 | 23,2 | 38,6 | 14,0 |
21 | 182 | 178 | -0,8 | -1,3 | 1,0 | 0,6 | 1,6 |
22 | 183 | 180 | 0,2 | 0,7 | 0,2 | 0,0 | 0,5 |
23 | 194 | 180 | 11,2 | 0,7 | 8,3 | 125,8 | 0,5 |
24 | 180 | 178 | -2,8 | -1,3 | 3,5 | 7,8 | 1,6 |
25 | 187 | 178 | 4,2 | -1,3 | -5,3 | 17,8 | 1,6 |
26 | 185 | 180 | 2,2 | 0,7 | 1,6 | 4,9 | 0,5 |
27 | 185 | 191 | 2,2 | 11,7 | 26,0 | 4,9 | 137,8 |
28 | 184 | 176 | 1,2 | -3,3 | -4,0 | 1,5 | 10,6 |
29 | 177 | 172 | -5,8 | -7,3 | 42,0 | 33,5 | 52,7 |
30 | 172 | 177 | -10,8 | -2,3 | 24,4 | 116,3 | 5,1 |
31 | 183 | 178 | 0,2 | -1,3 | -0,3 | 0,0 | 1,6 |
32 | 184 | 177 | 1,2 | -2,3 | -2,7 | 1,5 | 5,1 |
33 | 179 | 176 | -3,8 | -3,3 | 12,3 | 14,3 | 10,6 |
34 | 189 | 182 | 6,2 | 2,7 | 17,0 | 38,6 | 7,5 |
35 | 185 | 180 | 2,2 | 0,7 | 1,6 | 4,9 | 0,5 |
36 | 179 | 180 | -3,8 | 0,7 | -2,8 | 14,3 | 0,5 |
37 | 174 | 180 | -8,8 | 0,7 | -6,5 | 77,2 | 0,5 |
38 | 190 | 182 | 7,2 | 2,7 | 19,8 | 52,0 | 7,5 |
39 | 170 | 178 | -12,8 | -1,3 | 16,1 | 163,5 | 1,6 |
40 | 176 | 181 | -6,8 | 1,7 | -11,8 | 46,0 | 3,0 |
41 | 178 | 175 | -4,8 | -4,3 | 20,4 | 22,9 | 18,2 |
42 | 179 | 182 | -3,8 | 2,7 | -10,4 | 14,3 | 7,5 |
Сумма | 7677 | 7529 | 0,0 | 0,0 | 823,4 | 1461,1 | 1540,1 |
Среднее | 182,8 | 179,3 |
Таблица 4.3. Вспомогательная таблица для нахождения коэффициента корреляции между ростом сыновей и их отцами.
№ | Рост | s-<s> | m-<m> | (s-<s>)(m-<m>) | (s-<s>)^2 | (m-<m>)^2 | |
Сын (s) | Мать (m) | ||||||
1 | 184 | 170 | 1,2 | 2,7 | 3,2 | 1,5 | 7,1 |
2 | 188 | 164 | 5,2 | -3,3 | -17,4 | 27,2 | 11,1 |
3 | 185 | 172 | 2,2 | 4,7 | 10,3 | 4,9 | 21,8 |
4 | 190 | 172 | 7,2 | 4,7 | 33,7 | 52,0 | 21,8 |
5 | 174 | 172 | -8,8 | 4,7 | -41,0 | 77,2 | 21,8 |
6 | 180 | 172 | -2,8 | 4,7 | -13,0 | 7,8 | 21,8 |
7 | 184 | 168 | 1,2 | 0,7 | 0,8 | 1,5 | 0,4 |
8 | 195 | 173 | 12,2 | 5,7 | 69,2 | 149,2 | 32,1 |
9 | 189 | 170 | 6,2 | 2,7 | 16,6 | 38,6 | 7,1 |
10 | 190 | 173 | 7,2 | 5,7 | 40,9 | 52,0 | 32,1 |
11 | 189 | 165 | 6,2 | -2,3 | -14,5 | 38,6 | 5,4 |
12 | 178 | 168 | -4,8 | 0,7 | -3,2 | 22,9 | 0,4 |
13 | 171 | 168 | -11,8 | 0,7 | -7,9 | 138,9 | 0,4 |
14 | 183 | 170 | 0,2 | 2,7 | 0,6 | 0,0 | 7,1 |
15 | 185 | 175 | 2,2 | 7,7 | 17,0 | 4,9 | 58,8 |
16 | 184 | 175 | 1,2 | 7,7 | 9,3 | 1,5 | 58,8 |
17 | 178 | 164 | -4,8 | -3,3 | 16,0 | 22,9 | 11,1 |
18 | 180 | 168 | -2,8 | 0,7 | -1,9 | 7,8 | 0,4 |
19 | 186 | 164 | 3,2 | -3,3 | -10,7 | 10,3 | 11,1 |
20 | 189 | 170 | 6,2 | 2,7 | 16,6 | 38,6 | 7,1 |
21 | 182 | 160 | -0,8 | -7,3 | 5,8 | 0,6 | 53,8 |
22 | 183 | 177 | 0,2 | 9,7 | 2,1 | 0,0 | 93,4 |
23 | 194 | 172 | 11,2 | 4,7 | 52,3 | 125,8 | 21,8 |
24 | 180 | 168 | -2,8 | 0,7 | -1,9 | 7,8 | 0,4 |
25 | 187 | 168 | 4,2 | 0,7 | 2,8 | 17,8 | 0,4 |
26 | 185 | 182 | 2,2 | 14,7 | 32,5 | 4,9 | 215,1 |
27 | 185 | 170 | 2,2 | 2,7 | 5,9 | 4,9 | 7,1 |
28 | 184 | 160 | 1,2 | -7,3 | -8,9 | 1,5 | 53,8 |
29 | 177 | 162 | -5,8 | -5,3 | 30,9 | 33,5 | 28,4 |
30 | 172 | 159 | -10,8 | -8,3 | 89,9 | 116,3 | 69,4 |
31 | 183 | 171 | 0,2 | 3,7 | 0,8 | 0,0 | 13,4 |
32 | 184 | 178 | 1,2 | 10,7 | 13,0 | 1,5 | 113,8 |
33 | 179 | 167 | -3,8 | -0,3 | 1,3 | 14,3 | 0,1 |
34 | 189 | 169 | 6,2 | 1,7 | 10,4 | 38,6 | 2,8 |
35 | 185 | 157 | 2,2 | -10,3 | -22,9 | 4,9 | 106,8 |
36 | 179 | 157 | -3,8 | -10,3 | 39,1 | 14,3 | 106,8 |
37 | 174 | 157 | -8,8 | -10,3 | 90,8 | 77,2 | 106,8 |
38 | 190 | 162 | 7,2 | -5,3 | -38,5 | 52,0 | 28,4 |
39 | 170 | 152 | -12,8 | -15,3 | 196,0 | 163,5 | 235,1 |
40 | 176 | 163 | -6,8 | -4,3 | 29,4 | 46,0 | 18,8 |
41 | 178 | 161 | -4,8 | -6,3 | 30,3 | 22,9 | 40,1 |
42 | 179 | 163 | -3,8 | -4,3 | 16,4 | 14,3 | 18,8 |
Сумма | 7677 | 7028 | 0,0 | 0,0 | 702,0 | 1461,1 | 1673,3 |
Среднее | 182,8 | 167,3 |
Таблица 4.4. Вспомогательная таблица для нахождения коэффициента корреляции между ростом сыновей и их матерями.
№ | Рост | d-<d> | f-<f> | (d-<d>)(f-<f>) | (d-<d>)^2 | (f-<f>)^2 | |
Дочь (d) | Отец (f) | ||||||
1 | 172 | 188 | 4,1 | 7,3 | 29,7 | 16,6 | 53,3 |
2 | 162 | 192 | -5,9 | 11,3 | -67,0 | 35,1 | 127,7 |
3 | 160 | 182 | -7,9 | 1,3 | -10,3 | 62,8 | 1,7 |
4 | 158 | 179 | -9,9 | -1,7 | 16,9 | 98,5 | 2,9 |
5 | 166 | 185 | -1,9 | 4,3 | -8,3 | 3,7 | 18,5 |
6 | 177 | 185 | 9,1 | 4,3 | 39,0 | 82,4 | 18,5 |
7 | 178 | 200 | 10,1 | 19,3 | 194,4 | 101,5 | 372,5 |
8 | 175 | 198 | 7,1 | 17,3 | 122,4 | 50,1 | 299,3 |
9 | 173 | 188 | 5,1 | 7,3 | 37,0 | 25,8 | 53,3 |
10 | 166 | 160 | -1,9 | -20,7 | 39,8 | 3,7 | 428,5 |
11 | 160 | 170 | -7,9 | -10,7 | 84,8 | 62,8 | 114,5 |
12 | 160 | 182 | -7,9 | 1,3 | -10,3 | 62,8 | 1,7 |
13 | 172 | 178 | 4,1 | -2,7 | -11,0 | 16,6 | 7,3 |
14 | 162 | 169 | -5,9 | -11,7 | 69,3 | 35,1 | 136,9 |
15 | 168 | 183 | 0,1 | 2,3 | 0,2 | 0,0 | 5,3 |
16 | 159 | 192 | -8,9 | 11,3 | -100,9 | 79,7 | 127,7 |
17 | 158 | 175 | -9,9 | -5,7 | 56,6 | 98,5 | 32,5 |
18 | 173 | 172 | 5,1 | -8,7 | -44,2 | 25,8 | 75,7 |
19 | 165 | 180 | -2,9 | -0,7 | 2,0 | 8,6 | 0,5 |
20 | 165 | 173 | -2,9 | -7,7 | 22,5 | 8,6 | 59,3 |
21 | 166 | 178 | -1,9 | -2,7 | 5,2 | 3,7 | 7,3 |
22 | 169 | 187 | 1,1 | 6,3 | 6,8 | 1,2 | 39,7 |
23 | 172 | 187 | 4,1 | 6,3 | 25,7 | 16,6 | 39,7 |
24 | 160 | 172 | -7,9 | -8,7 | 68,9 | 62,8 | 75,7 |
25 | 173 | 185 | 5,1 | 4,3 | 21,8 | 25,8 | 18,5 |
26 | 161 | 178 | -6,9 | -2,7 | 18,7 | 48,0 | 7,3 |
27 | 168 | 178 | 0,1 | -2,7 | -0,2 | 0,0 | 7,3 |
28 | 174 | 185 | 6,1 | 4,3 | 26,1 | 36,9 | 18,5 |
29 | 185 | 190 | 17,1 | 9,3 | 158,8 | 291,6 | 86,5 |
30 | 165 | 172 | -2,9 | -8,7 | 25,4 | 8,6 | 75,7 |
31 | 175 | 181 | 7,1 | 0,3 | 2,1 | 50,1 | 0,1 |
32 | 170 | 181 | 2,1 | 0,3 | 0,6 | 4,3 | 0,1 |
33 | 164 | 177 | -3,9 | -3,7 | 14,5 | 15,4 | 13,7 |
34 | 181 | 178 | 13,1 | -2,7 | -35,3 | 171,0 | 7,3 |
35 | 174 | 188 | 6,1 | 7,3 | 44,3 | 36,9 | 53,3 |
36 | 160 | 178 | -7,9 | -2,7 | 21,4 | 62,8 | 7,3 |
37 | 177 | 180 | 9,1 | -0,7 | -6,4 | 82,4 | 0,5 |
38 | 162 | 175 | -5,9 | -5,7 | 33,8 | 35,1 | 32,5 |
39 | 164 | 171 | -3,9 | -9,7 | 38,1 | 15,4 | 94,1 |
40 | 168 | 176 | 0,1 | -4,7 | -0,4 | 0,0 | 22,1 |
Сумма | 6717 | 7228 | 0,0 | 0,0 | 933,1 | 1846,8 | 2544,4 |
Среднее | 167,9 | 180,7 |
Таблица 4.5. Вспомогательная таблица для нахождения коэффициента корреляции между ростом дочерей и их отцами.
№ | Рост | d-<d> | m-<m> | (d-<d>)(m-<m>) | (d-<d>)^2 | (m-<m>)^2 | |
Дочь (d) | Мать (m) | ||||||
1 | 172 | 164 | 4,1 | -2,3 | -9,5 | 16,6 | 5,4 |
2 | 162 | 162 | -5,9 | -4,3 | 25,6 | 35,1 | 18,7 |
3 | 160 | 172 | -7,9 | 5,7 | -45,0 | 62,8 | 32,2 |
4 | 158 | 165 | -9,9 | -1,3 | 13,2 | 98,5 | 1,8 |
5 | 166 | 160 | -1,9 | -6,3 | 12,2 | 3,7 | 40,0 |
6 | 177 | 173 | 9,1 | 6,7 | 60,6 | 82,4 | 44,6 |
7 | 178 | 168 | 10,1 | 1,7 | 16,9 | 101,5 | 2,8 |
8 | 175 | 165 | 7,1 | -1,3 | -9,4 | 50,1 | 1,8 |
9 | 173 | 163 | 5,1 | -3,3 | -16,9 | 25,8 | 11,1 |
10 | 166 | 178 | -1,9 | 11,7 | -22,5 | 3,7 | 136,3 |
11 | 160 | 158 | -7,9 | -8,3 | 66,0 | 62,8 | 69,3 |
12 | 160 | 168 | -7,9 | 1,7 | -13,3 | 62,8 | 2,8 |
13 | 172 | 169 | 4,1 | 2,7 | 10,9 | 16,6 | 7,2 |
14 | 162 | 152 | -5,9 | -14,3 | 84,9 | 35,1 | 205,2 |
15 | 168 | 167 | 0,1 | 0,7 | 0,1 | 0,0 | 0,5 |
16 | 159 | 146 | -8,9 | -20,3 | 181,4 | 79,7 | 413,1 |
17 | 158 | 158 | -9,9 | -8,3 | 82,6 | 98,5 | 69,3 |
18 | 173 | 195 | 5,1 | 28,7 | 145,5 | 25,8 | 822,3 |
19 | 165 | 177 | -2,9 | 10,7 | -31,2 | 8,6 | 114,0 |
20 | 165 | 166 | -2,9 | -0,3 | 1,0 | 8,6 | 0,1 |
21 | 166 | 167 | -1,9 | 0,7 | -1,3 | 3,7 | 0,5 |
22 | 169 | 158 | 1,1 | -8,3 | -8,9 | 1,2 | 69,3 |
23 | 172 | 176 | 4,1 | 9,7 | 39,4 | 16,6 | 93,6 |
24 | 160 | 165 | -7,9 | -1,3 | 10,5 | 62,8 | 1,8 |
25 | 173 | 173 | 5,1 | 6,7 | 33,9 | 25,8 | 44,6 |
26 | 161 | 160 | -6,9 | -6,3 | 43,8 | 48,0 | 40,0 |
27 | 168 | 168 | 0,1 | 1,7 | 0,1 | 0,0 | 2,8 |
28 | 174 | 171 | 6,1 | 4,7 | 28,4 | 36,9 | 21,9 |
29 | 185 | 175 | 17,1 | 8,7 | 148,1 | 291,6 | 75,3 |
30 | 165 | 162 | -2,9 | -4,3 | 12,7 | 8,6 | 18,7 |
31 | 175 | 161 | 7,1 | -5,3 | -37,7 | 50,1 | 28,4 |
32 | 170 | 161 | 2,1 | -5,3 | -11,0 | 4,3 | 28,4 |
33 | 164 | 159 | -3,9 | -7,3 | 28,8 | 15,4 | 53,7 |
34 | 181 | 180 | 13,1 | 13,7 | 178,8 | 171,0 | 187,0 |
35 | 174 | 177 | 6,1 | 10,7 | 64,9 | 36,9 | 114,0 |
36 | 160 | 160 | -7,9 | -6,3 | 50,1 | 62,8 | 40,0 |
37 | 177 | 164 | 9,1 | -2,3 | -21,1 | 82,4 | 5,4 |
38 | 162 | 161 | -5,9 | -5,3 | 31,6 | 35,1 | 28,4 |
39 | 164 | 167 | -3,9 | 0,7 | -2,6 | 15,4 | 0,5 |
40 | 168 | 162 | 0,1 | -4,3 | -0,3 | 0,0 | 18,7 |
Сумма | 6717 | 6653 | 0,0 | 0,0 | 1141,0 | 1846,8 | 2870,8 |
Среднее | 167,9 | 166,3 |
Таблица 4.6. Вспомогательная таблица для нахождения коэффициента корреляции между ростом дочерей и их матерями.
Теперь, зная коэффициенты корреляции, можно проверить, достоверна ли зависимость. Зная коэффициент корреляции, можно найти значение критерия Стьюдента, сравнить с критическим и сделать вывод о достоверности зависимости.
Итак, мы получили, что каждая из зависимостей достоверна. Рост и сыновей и дочерей зависит от каждого из родителей. Теперь можно написать уравнения регрессии, но прежде, чем мы это сделаем, осмыслим полученный результат.
Мы получили неравенство для параметрических коэффициентов корреляции:
А чем больше коэффициент корреляции (или, что то же самое, чем ближе он к единице, т. к. больше единицы он быть не может), тем сильнее зависимость. Однако можно ли утверждать, что рост сыновей больше зависит от отцов, чем от матерей, а рост дочерей, наоборот, больше зависит от матерей, чем от отцов? Формально нет. Ведь такое неравенство могло получиться случайным образом. По сути, чтобы проверить достоверность этого неравенства, надо высчитывать каждый из коэффициентов несколько раз на основании уже новых опросов, а затем сравнить четыре выборки на принадлежность одной генеральной совокупности. Однако есть основания полагать, что наше неравенство всё же верно без применения критериев: разница между коэффициентами довольно большая (кроме ), а количество степеней свободы велико.
Таким образом, можно дать оценку о том, насколько велик вклад каждого из родителей в рост сына/дочери.
1) Отец - сын (самая сильная зависимость)
2) Мать - дочь (вторая по силе)
3) Мать - сын, отец - дочь (самые слабые, но достоверные зависимости, примерно одинаковые по силе)
Перейдем к уравнениям регрессии.
Мы получили зависимости между ростом сыновей/дочерей с каждым из родителей. Теперь можно усреднить и получить зависимость роста сыновей/дочерей от обоих родителей, как функцию двух переменных. Итак, имеем
Обратите внимание, что коэффициент перед ростом матери в обоих уравнениях больше, чем перед ростом отцов. Этот результат понятен, кроме того, можно было бы заранее сказать, что так и получится. Почему? Потому что рост матерей в среднем на порядок меньше, чем рост отцов, поэтому, чтобы получить рост сына, рост матери надо помножить на большее число, чем рост отца. Так же и для дочерей. Не должен ввести в заблуждение и следующий образ мыслей: «Так как коэффициент перед ростом матери больше, чем перед ростом отца, то, следовательно, рост как мальчиков, так и девочек больше зависит от матери, чем от отца. С девочками мы уже получили ранее, что это верно, а с мальчиками происходит явное несогласование». На самом деле это неверно, и из величины коэффициента перед ростом матери или отца нельзя сделать выводы о силе связей. Продемонстрируем этот факт на примере.
Пусть имеется следующие данные о росте родителей, рассчитаем ожидаемый рост их сыновей. Рассчитаем параметрический коэффициент корреляции между ростом сыновей и каждым из их родителей Вычисления демонстрировать не будем. При необходимости читатель сам может проверить полученные результаты, ориентируясь на пример выше.
f | m | s(f,m) | |
200 | 170 | 186,8 | |
189 | 169 | 184,8 | |
188 | 168 | 184,4 | |
187 | 167 | 184,1 | |
186 | 166 | 183,7 | |
185 | 165 | 183,4 | |
184 | 164 | 183,0 | |
183 | 163 | 182,7 | |
182 | 162 | 182,3 | |
181 | 161 | 182,0 | |
сумма | 1865 | 1655 | 1837,1 |
среднее | 186,5 | 165,5 | 183,7 |
Видно, что коэффициент корреляция между ростом сыновей и отцов больше, чем между ростом сыновей и матерей.
Осталось только проверить, что при увеличении роста матерей и при уменьшении роста отцов, ожидаемый рост сыновей в среднем увеличится, а для новых коэффициентов корреляции сохранится прежнее неравенство.
Добавим к росту каждой матери 2 см и вычтем 2 см из роста каждого отца, получим:
f | m | s(f,m) | |
198 | 172 | 186,8 | |
187 | 171 | 184,9 | |
186 | 170 | 184,5 | |
185 | 169 | 184,2 | |
184 | 168 | 183,8 | |
183 | 167 | 183,4 | |
182 | 166 | 183,1 | |
181 | 165 | 182,7 | |
180 | 164 | 182,4 | |
179 | 163 | 182,0 | |
сумма | 1845 | 1675 | 1837,8 |
среднее | 184,5 | 167,5 | 183,8 |
Таким образом, все условия соблюдены. Следовательно, несмотря на то, что в уравнении для ожидаемого роста сына коэффициент перед ростом матери больше, чем пере ростом отца, корреляция между ростом сына и ростом отца сильнее, чем между ростом сына и матери.
Теперь, когда получены уравнения, которые позволят определить наиболее вероятный рост ребенка, возникает новый вопрос: а насколько они полезны? Насколько вероятно сильное отклонение от ожидаемого значения? Для этого определим доверительный интервал, в который войдет рост сыновей/дочерей для определенной доверительной вероятности.
Здесь и - стандартное отклонение. Формула будет иметь несколько хитрый вид, не такой, как обычно, так как мы ищем отклонение не от среднего, а от наиболее вероятного значения, которое зависит от роста каждого из родителей.
№ | Рост | s(f,m) | s-s(f,m) | (s-s(f,m))^2 | ||
Сын (s) | Отец (f) | Мать (m) | ||||
1 | 184 | 178 | 170 | 183,2 | 0,8 | 0,59 |
2 | 188 | 182 | 164 | 182,7 | 5,3 | 28,09 |
3 | 185 | 182 | 172 | 184,3 | 0,7 | 0,55 |
4 | 190 | 189 | 172 | 185,4 | 4,6 | 21,34 |
5 | 174 | 170 | 172 | 182,3 | -8,3 | 69,56 |
6 | 180 | 170 | 172 | 182,3 | -2,3 | 5,48 |
7 | 184 | 183 | 168 | 183,6 | 0,4 | 0,13 |
8 | 195 | 190 | 173 | 185,7 | 9,3 | 85,84 |
9 | 189 | 174 | 170 | 182,6 | 6,4 | 41,09 |
10 | 190 | 185 | 173 | 184,9 | 5,1 | 25,65 |
11 | 189 | 192 | 165 | 184,5 | 4,5 | 20,30 |
12 | 178 | 163 | 168 | 180,4 | -2,4 | 5,95 |
13 | 171 | 174 | 168 | 182,2 | -11,2 | 125,44 |
14 | 183 | 169 | 170 | 181,8 | 1,2 | 1,46 |
15 | 185 | 188 | 175 | 185,8 | -0,8 | 0,65 |
16 | 184 | 182 | 175 | 184,8 | -0,8 | 0,71 |
17 | 178 | 170 | 164 | 180,8 | -2,8 | 7,73 |
18 | 180 | 178 | 168 | 182,8 | -2,8 | 8,07 |
19 | 186 | 186 | 164 | 183,3 | 2,7 | 7,08 |
20 | 189 | 183 | 170 | 184,0 | 5,0 | 24,70 |
21 | 182 | 178 | 160 | 181,3 | 0,7 | 0,52 |
22 | 183 | 180 | 177 | 184,9 | -1,9 | 3,67 |
23 | 194 | 180 | 172 | 183,9 | 10,1 | 101,20 |
24 | 180 | 178 | 168 | 182,8 | -2,8 | 8,07 |
25 | 187 | 178 | 168 | 182,8 | 4,2 | 17,31 |
26 | 185 | 180 | 182 | 185,9 | -0,9 | 0,79 |
27 | 185 | 191 | 170 | 185,3 | -0,3 | 0,10 |
28 | 184 | 176 | 160 | 181,0 | 3,0 | 9,24 |
29 | 177 | 172 | 162 | 180,7 | -3,7 | 13,76 |
30 | 172 | 177 | 159 | 180,9 | -8,9 | 79,66 |
31 | 183 | 178 | 171 | 183,4 | -0,4 | 0,18 |
32 | 184 | 177 | 178 | 184,6 | -0,6 | 0,40 |
33 | 179 | 176 | 167 | 182,3 | -3,3 | 11,06 |
34 | 189 | 182 | 169 | 183,7 | 5,3 | 28,36 |
35 | 185 | 180 | 157 | 181,0 | 4,0 | 15,88 |
36 | 179 | 180 | 157 | 181,0 | -2,0 | 4,06 |
37 | 174 | 180 | 157 | 181,0 | -7,0 | 49,21 |
38 | 190 | 182 | 162 | 182,3 | 7,7 | 59,14 |
39 | 170 | 178 | 152 | 179,7 | -9,7 | 94,48 |
40 | 176 | 181 | 163 | 182,3 | -6,3 | 40,26 |
41 | 178 | 175 | 161 | 181,0 | -3,0 | 8,97 |
42 | 179 | 182 | 163 | 182,5 | -3,5 | 12,29 |
Сумма | -5,3 | 1039 |
Таблица 4.7. Вспомогательная таблица для нахождения стандартного отклонения для наиболее вероятного роста сына.
№ | Рост | d(f,m) | d-d(f,m) | (d-d(f,m))^2 | ||
Дочь (d) | Отец (f) | Мать (m) | ||||
1 | 172 | 188 | 164 | 168 | 4,0 | 15,68 |
2 | 162 | 192 | 162 | 168,1 | -6,1 | 37,33 |
3 | 160 | 182 | 172 | 169,3 | -9,3 | 86,68 |
4 | 158 | 179 | 165 | 166,9 | -8,9 | 79,57 |
5 | 166 | 185 | 160 | 166,5 | -0,5 | 0,23 |
6 | 177 | 185 | 173 | 170,1 | 6,9 | 48,30 |
7 | 178 | 200 | 168 | 171 | 7,0 | 49,00 |
8 | 175 | 198 | 165 | 169,9 | 5,1 | 26,37 |
9 | 173 | 188 | 163 | 167,8 | 5,2 | 27,41 |
10 | 166 | 160 | 178 | 167,6 | -1,6 | 2,40 |
11 | 160 | 170 | 158 | 163,6 | -3,6 | 12,96 |
12 | 160 | 182 | 168 | 168,2 | -8,2 | 67,40 |
13 | 172 | 178 | 169 | 167,9 | 4,1 | 17,10 |
14 | 162 | 169 | 152 | 161,8 | 0,2 | 0,04 |
15 | 168 | 183 | 167 | 168,1 | -0,1 | 0,01 |
16 | 159 | 192 | 146 | 163,7 | -4,7 | 22,18 |
17 | 158 | 175 | 158 | 164,4 | -6,4 | 40,64 |
18 | 173 | 172 | 195 | 174,1 | -1,1 | 1,18 |
19 | 165 | 180 | 177 | 170,4 | -5,4 | 28,89 |
20 | 165 | 173 | 166 | 166,3 | -1,3 | 1,60 |
21 | 166 | 178 | 167 | 167,3 | -1,3 | 1,73 |
22 | 169 | 187 | 158 | 166,2 | 2,8 | 7,65 |
23 | 172 | 187 | 176 | 171,2 | 0,8 | 0,66 |
24 | 160 | 172 | 165 | 165,8 | -5,8 | 34,05 |
25 | 173 | 185 | 173 | 170,1 | 2,9 | 8,70 |
26 | 161 | 178 | 160 | 165,4 | -4,4 | 19,27 |
27 | 168 | 178 | 168 | 167,6 | 0,4 | 0,17 |
28 | 174 | 185 | 171 | 169,5 | 4,5 | 20,25 |
29 | 185 | 190 | 175 | 171,4 | 13,6 | 185,64 |
30 | 165 | 172 | 162 | 165 | 0,0 | 0,00 |
31 | 175 | 181 | 161 | 166,1 | 8,9 | 78,68 |
32 | 170 | 181 | 161 | 166,1 | 3,9 | 14,98 |
33 | 164 | 177 | 159 | 165 | -1,0 | 0,92 |
34 | 181 | 178 | 180 | 170,9 | 10,1 | 102,21 |
35 | 174 | 188 | 177 | 171,6 | 2,4 | 5,69 |
36 | 160 | 178 | 160 | 165,4 | -5,4 | 29,05 |
37 | 177 | 180 | 164 | 166,8 | 10,2 | 104,04 |
38 | 162 | 175 | 161 | 165,2 | -3,2 | 10,24 |
39 | 164 | 171 | 167 | 166,2 | -2,2 | 4,97 |
40 | 168 | 176 | 162 | 165,6 | 2,4 | 5,62 |
Сумма | 15,1 | 1199 |
Таблица 4.8. Вспомогательная таблица для нахождения стандартного отклонения для наиболее вероятного роста дочери.
Итак, получены доверительные интервалы, в которые с вероятностью 0,7 должны войти рост сыновей и дочерей. На основание полученных результатов можно утверждать, что генетика играет ключевую роль в определении роста человека. Без каких-либо дополнительных данных нам удалось подтвердить достоверность зависимости между ростом детей и их родителей, найти уравнения, которые позволяют определить наиболее вероятный рост ребенка и интервал, в который должен войти рост ребенка с вероятностью 0,7. Доверительный интервал получился достаточно узкий. Его можно сделать ещё уже, если учесть влияние других факторов, например, физической нагрузки и питания. Можно найти интервал для любой другой вероятности, использую таблицу критический значений коэффициента Стьюдента (таблица 3.3). Или, наоборот, можно найти вероятностный интервал, в который должен войти рост ребенка при заданном доверительном интервале. Возможность попрактиковаться в этом мы оставим читателю.
Обобщим полученные результаты, чтобы читатель мог легко мог пользоваться ими в своих целях.
Уравнения, который позволят определить наиболее вероятный рост ребенка (первое для сына, второе для дочери).
f - рост отца, m - рост матери.
Интервал, в который должно войти истинное значение роста ребенка с вероятностью 0,7 (первое для сына, второе дл дочери)
Глава 5. «Разрыв поколений» или ещё немного о росте.
В предыдущей главе были представлены данные о росте детей и их родителей. Большинство опрошенных «сыновей» и «дочерей» из одного поколения (20-30 лет), а, значит, можно предположить, что и их родители одного поколения. Как было замечено из предыдущей главы средний рост у матерей меньше, чем у дочерей, а у отцов меньше, чем у сыновей. Возникает вопрос: это случайность или есть достоверное различие между ростом одного и ростом другого поколений? Если различие есть, то можно искать причины этого различия. И тут дело явно не в генетике, а во второстепенных факторах.
Проверим, достоверно ли различие в средних значениях роста у двух поколений. Используем для этого описанный в 3 главе критерий Стьюдента.
№ | Рост | (d-<d>)^2 | (m-<m>)^2 | (s-<s>)^2 | (f-<f>)^2 | |||
Дочь (d) | Мать (m) | Сын (s) | Отец (f) | |||||
1 | 172 | 164 | 184 | 178 | 16,6 | 5,4 | 1,0 | 1,7 |
2 | 162 | 162 | 188 | 182 | 35,1 | 18,7 | 25,0 | 7,3 |
3 | 160 | 172 | 185 | 182 | 62,8 | 32,2 | 4,0 | 7,3 |
4 | 158 | 165 | 190 | 189 | 98,5 | 1,8 | 49,0 | 94,1 |
5 | 166 | 160 | 174 | 170 | 3,7 | 40,0 | 81,0 | 86,5 |
6 | 177 | 173 | 180 | 170 | 82,4 | 44,6 | 9,0 | 86,5 |
7 | 178 | 168 | 184 | 183 | 101,5 | 2,8 | 1,0 | 13,7 |
8 | 175 | 165 | 195 | 190 | 50,1 | 1,8 | 144,0 | 114,5 |
9 | 173 | 163 | 189 | 174 | 25,8 | 11,1 | 36,0 | 28,1 |
10 | 166 | 178 | 190 | 185 | 3,7 | 136,3 | 49,0 | 32,5 |
11 | 160 | 158 | 189 | 192 | 62,8 | 69,3 | 36,0 | 161,3 |
12 | 160 | 168 | 178 | 163 | 62,8 | 2,8 | 25,0 | 265,7 |
13 | 172 | 169 | 171 | 174 | 16,6 | 7,2 | 144,0 | 28,1 |
14 | 162 | 152 | 183 | 169 | 35,1 | 205,2 | 0,0 | 106,1 |
15 | 168 | 167 | 185 | 188 | 0,0 | 0,5 | 4,0 | 75,7 |
16 | 159 | 146 | 184 | 182 | 79,7 | 413,1 | 1,0 | 7,3 |
17 | 158 | 158 | 178 | 170 | 98,5 | 69,3 | 25,0 | 86,5 |
18 | 173 | 195 | 180 | 178 | 25,8 | 822,3 | 9,0 | 1,7 |
19 | 165 | 177 | 186 | 186 | 8,6 | 114,0 | 9,0 | 44,9 |
20 | 165 | 166 | 189 | 183 | 8,6 | 0,1 | 36,0 | 13,7 |
21 | 166 | 167 | 182 | 178 | 3,7 | 0,5 | 1,0 | 1,7 |
22 | 169 | 158 | 183 | 180 | 1,2 | 69,3 | 0,0 | 0,5 |
23 | 172 | 176 | 194 | 180 | 16,6 | 93,6 | 121,0 | 0,5 |
24 | 160 | 165 | 180 | 178 | 62,8 | 1,8 | 9,0 | 1,7 |
25 | 173 | 173 | 187 | 178 | 25,8 | 44,6 | 16,0 | 1,7 |
26 | 161 | 160 | 185 | 180 | 48,0 | 40,0 | 4,0 | 0,5 |
27 | 168 | 168 | 185 | 191 | 0,0 | 2,8 | 4,0 | 136,9 |
28 | 174 | 171 | 184 | 176 | 36,9 | 21,9 | 1,0 | 10,9 |
29 | 185 | 175 | 177 | 172 | 291,6 | 75,3 | 36,0 | 53,3 |
30 | 165 | 162 | 172 | 177 | 8,6 | 18,7 | 121,0 | 5,3 |
31 | 175 | 161 | 183 | 178 | 50,1 | 28,4 | 0,0 | 1,7 |
32 | 170 | 161 | 184 | 177 | 4,3 | 28,4 | 1,0 | 5,3 |
33 | 164 | 159 | 179 | 176 | 15,4 | 53,7 | 16,0 | 10,9 |
34 | 181 | 180 | 189 | 182 | 171,0 | 187,0 | 36,0 | 7,3 |
35 | 174 | 177 | 185 | 180 | 36,9 | 114,0 | 4,0 | 0,5 |
36 | 160 | 160 | 179 | 180 | 62,8 | 40,0 | 16,0 | 0,5 |
37 | 177 | 164 | 174 | 180 | 82,4 | 5,4 | 81,0 | 0,5 |
38 | 162 | 161 | 190 | 182 | 35,1 | 28,4 | 49,0 | 7,3 |
39 | 164 | 167 | 170 | 178 | 15,4 | 0,5 | 169,0 | 1,7 |
40 | 168 | 162 | 176 | 181 | 0,0 | 18,7 | 49,0 | 2,9 |
Сумма | 6717 | 6653 | 7320 | 7172 | 1847 | 2871 | 1422 | 1514 |
Среднее | 167,9 | 166,3 | 183,0 | 179,3 |
Таблица 5.1. Вспомогательная таблица для нахождения критерия Стьюдента
В таблице 5.1 Мать - это мать дочери, а Отец - отец сына, других родственных связей здесь нет. Однако это никак не повлияет на результаты, нас не интересуют родственные связи совсем, только рост у людей разных поколений. Просто данные взяты из главы 4.
Будем искать два значения критерия: для выборок «мать-дочь» и «отец-сын».
Нулевая гипотеза: различие в росте у двух представленных поколений недостоверно.
Важное замечание. Критическое значение мы брали для α=0,01, то есть вероятность того, что мы ошибочно отвергли (приняли) нулевую гипотезу меньше 0,01. Однако мы делали вывод о принятии нулевой гипотезы дважды, поэтому вероятность хоть раз ошибиться на самом деле меньше α’
Получили истинный уровень значимости. Теперь осмыслим полученный результат.
Достоверно различие в росте только у мужчин. Значит, в последнее время изменения в жизни мужчин происходили более резкие, чем у женщин. Возможно, однако, и другое объяснение: данные о росте нам предоставляли сыновья и дочери, а так как «быть выше» все равно, что «быть круче», особенно среди мужчин, сыновья могли, возможно, неосознанно завышать свой рост. Завышения оказалось незначительным, но при таком большом количестве опрошенных его можно отследить. Возможность докопаться до истины в данном вопросе мы предоставим читателю. Мне, например, второе объяснение кажется более вероятным. И если я прав, то анализ в этой главе может послужить примером, как статистическими методами могут пользоваться в психологии. В свою очередь это опять подтверждает, что статистика может решать задачи абсолютно различные на вкус и цвет…
Дата добавления: 2018-08-06; просмотров: 161; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!