Глава 5. «Разрыв поколений» или ещё немного о росте.



Санкт-Петербургский государственный политехнический университет

Институт физики, нанотехнологий и телекоммуникаций

 

 

Проектная работа: «Статистика жизни»

 

 

Выполнили студенты ИФНиТа:

Кондратьев А.С. (23431/4)

Ананьева А.Д. (23431/4)

 Брасс А.А. (23431/1)

Ларионов В.Е. (23431/4)

Салманов В.Х. (23431/4)

Тихонова Т.А. (23431/4)

Шаврин А.А. (23431/2)

Шишканова Ю.П. (23431/4)    

 

Санкт-Петербург

2018

 

Оглавление:

Глава 1

Связь между цветом глаз и цветом волос ……………………………………...3

Глава 2

Среда заела …………………………………………………………………….. 5

Глава 3

Что сложнее? …………………………………………………………………….. 6

Глава 4

Яблоко от яблони ……...……………………………………………………….. 10

Глава 5

«Разрыв поколений» или ещё немного о росте...…………………………….. 23

Глава 6

Всё, что я говорю, будет на ЕГЭ………………..…………………………….. 25

Литература   ….……………………………………………………………….. 28

 

 

Глава 1. Связь между цветом глаз и цветом волос

Чтобы определить, есть ли связь между цветом глаз и цветом волос, для начала нужно собрать данные. Составленный нами опрос дал следующие результаты:

глаза/волосы

Блондин

Брюнет

Каштановый

Русый

Рыжий

Всего

Голубые

4

3

7

78

3

95

Зелёные

4

11

14

52

4

85

Карие

2

38

23

48

2

113

Всего

10

52

44

178

9

293

Таблица 1.1. Количество опрошенных с соответствующим цветом глаз и волос.

Несмотря на то, что цвет - это качественный признак, к нему можно применить методы статистики. Существует критерий под названием «Хи-квадрат», который поможет сделать вывод о том, существует ли связь между цветом глаз и цветом волос.

Формулируем нулевую гипотезу: связи между цветом глаз и цветом волос нет. Это значит, что вероятность иметь глаза, например, голубого цвета у блондина такая же, как у всех остальных.

Если связи нет, то мы можем построить таблицу ожидаемых значений. То есть наиболее вероятные результаты опроса, если бы нулевая гипотеза оказалась бы верна.

глаза/волосы

Блондин

Брюнет

Каштановый

Русый

Рыжий

Всего

Голубые

3,24

16,86

14,27

57,71

2,92

95

Зелёные

2,90

15,09

12,76

51,64

2,61

85

Карие

3,86

20,05

16,97

68,65

3,47

113

Всего

10

52

44

178

9

293

Таблица 1.2. Ожидаемые результаты опроса.

Рассчитываем значение критерия:

 

 

Теперь, чтобы сделать вывод, надо сравнить это значение с критическим из таблицы:

k/α 0,05 0,01 0,001
1 3,841 6,635 10,827
2 5,991 9,21 13,815
3 7,815 11,341 16,268
4 9,488 13,277 18,465
5 11,07 15,086 20,517
6 12,592 16,812 22,457
7 14,067 18,475 24,322
8 15,507 20,09 26,125
9 16,919 21,666 27,877
10 18,307 23,209 29,588
11 19,675 24,725 31,264
12 21,026 26,217 32,909
13 22,362 27,688 34,528
14 23,685 29,141 36,123
15 24,996 30,578 37,697

Таблица 1.3.Таблица критических значений критерия Хи-квадрат.

Проанализируем полученные результаты. Нулевая гипотеза отвергается, то есть, связь между цветом глаз и цветом волос есть. В частности, вероятнее, что карие глаза будут у брюнета, чем у блондина. α - уровень значимости. Нулевая гипотеза будет отвергаться даже для уровня значимости α=0,001. Это означает, что если десять тысяч раз провести подобный опрос, то нулевая гипотеза будет подтверждена меньше, чем в одном из них.

Полученный результат может быть толчком к новому исследованию в биологии. Если цвет глаз и волос связаны, то в чём причина этой связи?

Замечания: чтобы применить критерий «Хи-квадрат» рекомендуется, чтобы в таблице сопряженности (Таблица 1.1) в каждой ячейке стояла число больше 5. Несмотря на то, что данная рекомендация у нас не выполнена, полученный вывод можно считать достоверным, потому что критическое значение критерия оказалось НАМНОГО меньше экспериментального.

 

 

Глава 2. Среда заела

В этой главе проверим, влияет ли место жительства на успеваемость в учёбе. Если, например, окажется, что студенты из общежитий успевают хуже местных, то в интересах Политехнического университета будет улучшить условия жизни в общежитиях, ведь они могут потерять хороших студентов. Интересы же студентов в этом вопросе очевидны. Таким образом, результаты этого анализа будут весьма полезны.

Для анализа применим критерий Пирсона (Хи-квадрат). Он уже был рассмотрен в главе 1, поэтому не будем расписывать его так подробно.

Результаты проведенного нами опроса среди студентов второго курса направления «физика»:

Балл за третий семестр

>23,6

Балл за третий семестр

<23,6

Всего

Живут в общежитии

6

7

13

Не живут в общежитии

14

11

25

Всего

20

18

38

Таблица 2.1. Наблюдаемые величины распределения студентов по баллам в зависимости от места жительства.

Формулируем нулевую гипотезу: место жительства не влияет на успеваемость.

Строим таблицу ожидаемых величин:

Балл за третий семестр

>23,6

Балл за третий семестр

<23,6

Всего

Живут в общежитии

6,84

6,16

13

Не живут в общежитии

13,16

11,84

25

Всего

20

18

38

Таблица 2.2.Ожидаемые величины распределения студентов по баллам в зависимости от места жительства, если верна нулевая гипотеза.

Таким образом, нулевая гипотеза принимается, и студенты из общежитий учатся так же успешно(неуспешно), как местные. Однако это ещё не значит, что нет разницы между жизнью в общежитии и в квартире. Вероятно, различие будет в других сферах деятельности, так что нужны дополнительные исследования, чтобы найти аргументы для улучшения уровня жизни в общежитиях.

Глава 3. Что сложнее?

В целях повышения успеваемости студентов дирекция ИФНиТа может попробовать на сессии оставлять как можно больше времени на подготовку к сложным предметам. Но как определить, какой предмет сложнее, то есть, какой предмет в среднем сдают хуже? Конечно, можно посмотреть на известные результаты экзаменов по разным предметам. Но разве тот, который сдают лучше, будет всегда легче? Нет, разумеется. Если, например, два экзамена одинаковы по сложности, то иногда первый сдавать будут лучше другого, а иногда наоборот. И в данном случае ошибка в определении более сложного экзамена пойдёт только во вред успеваемости студентов.

Чтобы достоверно определить, какой экзамен сложнее, воспользуемся критерием Стьюдента. Здесь и далее везде подразумеваем, что преподаватели и экзаменаторы для каждого предмета одни и те же. То есть мы не можем говорить о сложности экзамена, если его принимают разные преподаватели. Покажем, как это сделать. Определим, достоверна ли разница в средних оценках за экзамены в третьем семестре у групп направления «физика» по математическому анализу и физике.

Надо отметить, что для применения критерия Стьюдента, как и критерия «Хи-квадрат», необходимо, чтобы наблюдаемое распределение случайной величины было близко к нормальному. Очевидно, это условие выполнено, как в этой главе, так и в предыдущих главах.

Результаты проведенного нами опроса:

Мат. анализ

Физика

1

2

3

2

2

4

3

2

3

4

2

3

5

2

2

6

2

3

7

2

3

8

2

4

9

3

5

10

3

4

11

3

5

12

3

3

13

3

4

14

3

4

15

3

5

16

3

3

17

3

4

18

3

5

19

3

5

20

3

5

21

4

3

22

4

5

23

4

4

24

4

4

25

4

3

26

4

4

27

4

4

28

4

4

29

4

5

30

4

4

31

4

4

32

4

5

33

4

5

34

4

5

35

5

5

36

5

4

37

5

4

38

5

5


Таблица 3.1. Результаты студентов направления «физика» за экзамены по математическому анализу и физике в третьем семестре.

Подход такой же, как в первых двух главах: формулируем нулевую гипотезу, ищем экспериментальное значение критерия Стьюдента и сравниваем его с критическим.

Нулевая гипотеза: различие в средних оценках у студентов по физике и математике недостоверно.

Значение критерия Стьюдента находим по следующей формуле:

Мат. анализ (x)

Физика (y)

x-<x>

y-<y>

(x-<x>)^2

(y-<y>)^2

1

2

3

-1,37

-1,05

1,87

1,11

2

2

4

-1,37

-0,05

1,87

0,00

3

2

3

-1,37

-1,05

1,87

1,11

4

2

3

-1,37

-1,05

1,87

1,11

5

2

2

-1,37

-2,05

1,87

4,21

6

2

3

-1,37

-1,05

1,87

1,11

7

2

3

-1,37

-1,05

1,87

1,11

8

2

4

-1,37

-0,05

1,87

0,00

9

3

5

-0,37

0,95

0,14

0,90

10

3

4

-0,37

-0,05

0,14

0,00

11

3

5

-0,37

0,95

0,14

0,90

12

3

3

-0,37

-1,05

0,14

1,11

13

3

4

-0,37

-0,05

0,14

0,00

14

3

4

-0,37

-0,05

0,14

0,00

15

3

5

-0,37

0,95

0,14

0,90

16

3

3

-0,37

-1,05

0,14

1,11

17

3

4

-0,37

-0,05

0,14

0,00

18

3

5

-0,37

0,95

0,14

0,90

19

3

5

-0,37

0,95

0,14

0,90

20

3

5

-0,37

0,95

0,14

0,90

21

4

3

0,63

-1,05

0,40

1,11

22

4

5

0,63

0,95

0,40

0,90

23

4

4

0,63

-0,05

0,40

0,00

24

4

4

0,63

-0,05

0,40

0,00

25

4

3

0,63

-1,05

0,40

1,11

26

4

4

0,63

-0,05

0,40

0,00

27

4

4

0,63

-0,05

0,40

0,00

28

4

4

0,63

-0,05

0,40

0,00

29

4

5

0,63

0,95

0,40

0,90

30

4

4

0,63

-0,05

0,40

0,00

31

4

4

0,63

-0,05

0,40

0,00

32

4

5

0,63

0,95

0,40

0,90

33

4

5

0,63

0,95

0,40

0,90

34

4

5

0,63

0,95

0,40

0,90

35

5

5

1,63

0,95

2,66

0,90

36

5

4

1,63

-0,05

2,66

0,00

37

5

4

1,63

-0,05

2,66

0,00

38

5

5

1,63

0,95

2,66

0,90

сумма

128

154

0,00

0,00

32,84

25,89

среднее

3,37

4,05

Таблица 3.2. Обработка данных из таблицы 3.1 (под двойкой имеется в виду «неудовлетворительно»).

Подставляем полученные данные в формулу для tэ

 

k α=0,05 α=0,01 α=0,001
1 12,7 63,65 636,61
2 4,303 9,925 31,602
3 3,182 5,841 12,923
4 2,776 4,604 8,610
5 2,571 4,032 6,869
6 2,447 3,707 5,959
7 2,365 3,499 5,408
8 2,306 3,355 5,041
9 2,262 3,250 4,781
10 2,228 3,169 4,587
11 2,201 3,106 4,437
12 2,179 3,055 4,318
13 2,16 3,012 4,221
14 2,145 2,977 4,140
15 2,131 2,947 4,073
16 2,12 2,921 4,015
17 2,11 2,898 3,965
18 2,101 2,878 3,922
19 2,093 2,861 3,883
20 2,086 2,845 3,850
21 2,08 2,831 3,819
22 2,074 2,819 3,792
23 2,069 2,807 3,768
24 2,064 2,797 3,745
25 2,06 2,787 3,725
26 2,056 2,779 3,707
27 2,052 2,771 3,690
28 2,049 2,763 3,674
29 2,045 2,756 3,659
30 2,042 2,750 3,646
31 2,04 2,744 3,633
32 2,037 2,738 3,622
33 2,035 2,733 3,611
34 2,032 2,728 3,601
35 2,03 2,724 3,591
36 2,028 2,719 3,582
37 2,026 2,715 3,574
38 2,024 2,712 3,566
39 2,023 2,708 3,558
40 2,021 2,704 3,551

Таблица 3.3. Критические значения критерия Стьюдента.

Сравним с критическим значением:

Таким образом, в среднем студенты сдают физику лучше, чем математический анализ. Значит, стоит оставлять больше времени на подготовку к математическому анализу.

Глава 4. Яблоко от яблони…

В этой главе мы определим, есть ли связь между ростом детей и их родителей. Под ростом детей будем понимать максимальное значение роста, которого они достигнут. Если окажется, что связь есть, можно будет написать уравнения регрессии, которые помогут предсказать наиболее вероятный рост детей, обладая знаниями о росте родителей. Очевидно, на рост влияет не только генетика, но и факторы другого рода, например, питание и физическая активность.

Воспользуемся корреляционным анализом Пирсона. Это параметрический критерий, то есть им можно пользоваться, если распределение случайной величины (роста) подчиняется нормальному закону. В данном случае, очевидно, это условие выполнено.

Итак, применим этот метод. Вначале найдём коэффициент корреляции. Если окажется, что коэффициент корреляции близок к единице, то влияние на рост генетики самое значительное из всех факторов, определяющих рост. И чем ближе коэффициент корреляции к единице, тем больше вклад генетики.

Результаты, проведенного нами опроса (рост везде измеряется в см):

Рост

Рост

Сын Отец Мать Дочь Отец Мать
1 184 178 170 1 172 188 164
2 188 182 164 2 162 192 162
3 185 182 172 3 160 182 172
4 190 189 172 4 158 179 165
5 174 170 172 5 166 185 160
6 180 170 172 6 177 185 173
7 184 183 168 7 178 200 168
8 195 190 173 8 175 198 165
9 189 174 170 9 173 188 163
10 190 185 173 10 166 160 178
11 189 192 165 11 160 170 158
12 178 163 168 12 160 182 168
13 171 174 168 13 172 178 169
14 183 169 170 14 162 169 152
15 185 188 175 15 168 183 167
16 184 182 175 16 159 192 146
17 178 170 164 17 158 175 158
18 180 178 168 18 173 172 195
19 186 186 164 19 165 180 177
20 189 183 170 20 165 173 166
21 182 178 160 21 166 178 167
22 183 180 177 22 169 187 158
23 194 180 172 23 172 187 176
24 180 178 168 24 160 172 165
25 187 178 168 25 173 185 173
26 185 180 182 26 161 178 160
27 185 191 170 27 168 178 168
28 184 176 160 28 174 185 171
29 177 172 162 29 185 190 175
30 172 177 159 30 165 172 162
31 183 178 171 31 175 181 161
32 184 177 178 32 170 181 161
33 179 176 167 33 164 177 159
34 189 182 169 34 181 178 180
35 185 180 157 35 174 188 177
36 179 180 157 36 160 178 160
37 174 180 157 37 177 180 164
38 190 182 162 38 162 175 161
39 170 178 152 39 164 171 167
40 176 181 163 40 168 176 162
41 178 175 161
42 179 182 163

Таблица 4.1.

Рост сыновей и их родителей.

Таблица 4.2.

Рост дочерей и их родителей.

 

Параметрический коэффициент корреляции определяется по формуле:

Естественно, нельзя рассчитать коэффициент корреляции сразу для обоих родителей, поэтому для каждого из родителей рассчитаем свой коэффициент корреляции. Заодно можно будет проверить, какой из родителей вносит больший вклад в рост ребенка.

 Составим вспомогательные таблицы для нахождения коэффициента корреляции.

Рост

s-<s>

f-<f>

(s-<s>)(f-<f>)

(s-<s>)^2

(f-<f>)^2

Сын (s) Отец (f)
1 184 178

1,2

-1,3

-1,5

1,5

1,6

2 188 182

5,2

2,7

14,3

27,2

7,5

3 185 182

2,2

2,7

6,1

4,9

7,5

4 190 189

7,2

9,7

70,3

52,0

94,8

5 174 170

-8,8

-9,3

81,4

77,2

85,8

6 180 170

-2,8

-9,3

25,8

7,8

85,8

7 184 183

1,2

3,7

4,5

1,5

14,0

8 195 190

12,2

10,7

131,2

149,2

115,3

9 189 174

6,2

-5,3

-32,7

38,6

27,7

10 190 185

7,2

5,7

41,4

52,0

32,9

11 189 192

6,2

12,7

79,2

38,6

162,3

12 178 163

-4,8

-16,3

77,8

22,9

264,4

13 171 174

-11,8

-5,3

62,0

138,9

27,7

14 183 169

0,2

-10,3

-2,2

0,0

105,3

15 185 188

2,2

8,7

19,3

4,9

76,4

16 184 182

1,2

2,7

3,3

1,5

7,5

17 178 170

-4,8

-9,3

44,3

22,9

85,8

18 180 178

-2,8

-1,3

3,5

7,8

1,6

19 186 186

3,2

6,7

21,7

10,3

45,4

20 189 183

6,2

3,7

23,2

38,6

14,0

21 182 178

-0,8

-1,3

1,0

0,6

1,6

22 183 180

0,2

0,7

0,2

0,0

0,5

23 194 180

11,2

0,7

8,3

125,8

0,5

24 180 178

-2,8

-1,3

3,5

7,8

1,6

25 187 178

4,2

-1,3

-5,3

17,8

1,6

26 185 180

2,2

0,7

1,6

4,9

0,5

27 185 191

2,2

11,7

26,0

4,9

137,8

28 184 176

1,2

-3,3

-4,0

1,5

10,6

29 177 172

-5,8

-7,3

42,0

33,5

52,7

30 172 177

-10,8

-2,3

24,4

116,3

5,1

31 183 178

0,2

-1,3

-0,3

0,0

1,6

32 184 177

1,2

-2,3

-2,7

1,5

5,1

33 179 176

-3,8

-3,3

12,3

14,3

10,6

34 189 182

6,2

2,7

17,0

38,6

7,5

35 185 180

2,2

0,7

1,6

4,9

0,5

36 179 180

-3,8

0,7

-2,8

14,3

0,5

37 174 180

-8,8

0,7

-6,5

77,2

0,5

38 190 182

7,2

2,7

19,8

52,0

7,5

39 170 178

-12,8

-1,3

16,1

163,5

1,6

40 176 181

-6,8

1,7

-11,8

46,0

3,0

41 178 175

-4,8

-4,3

20,4

22,9

18,2

42 179 182

-3,8

2,7

-10,4

14,3

7,5

Сумма

7677

7529

0,0

0,0

823,4

1461,1

1540,1

Среднее

182,8

179,3

Таблица 4.3. Вспомогательная таблица для нахождения коэффициента корреляции между ростом сыновей и их отцами.

Рост

s-<s>

m-<m>

(s-<s>)(m-<m>)

(s-<s>)^2

(m-<m>)^2

Сын (s) Мать (m)
1 184 170

1,2

2,7

3,2

1,5

7,1

2 188 164

5,2

-3,3

-17,4

27,2

11,1

3 185 172

2,2

4,7

10,3

4,9

21,8

4 190 172

7,2

4,7

33,7

52,0

21,8

5 174 172

-8,8

4,7

-41,0

77,2

21,8

6 180 172

-2,8

4,7

-13,0

7,8

21,8

7 184 168

1,2

0,7

0,8

1,5

0,4

8 195 173

12,2

5,7

69,2

149,2

32,1

9 189 170

6,2

2,7

16,6

38,6

7,1

10 190 173

7,2

5,7

40,9

52,0

32,1

11 189 165

6,2

-2,3

-14,5

38,6

5,4

12 178 168

-4,8

0,7

-3,2

22,9

0,4

13 171 168

-11,8

0,7

-7,9

138,9

0,4

14 183 170

0,2

2,7

0,6

0,0

7,1

15 185 175

2,2

7,7

17,0

4,9

58,8

16 184 175

1,2

7,7

9,3

1,5

58,8

17 178 164

-4,8

-3,3

16,0

22,9

11,1

18 180 168

-2,8

0,7

-1,9

7,8

0,4

19 186 164

3,2

-3,3

-10,7

10,3

11,1

20 189 170

6,2

2,7

16,6

38,6

7,1

21 182 160

-0,8

-7,3

5,8

0,6

53,8

22 183 177

0,2

9,7

2,1

0,0

93,4

23 194 172

11,2

4,7

52,3

125,8

21,8

24 180 168

-2,8

0,7

-1,9

7,8

0,4

25 187 168

4,2

0,7

2,8

17,8

0,4

26 185 182

2,2

14,7

32,5

4,9

215,1

27 185 170

2,2

2,7

5,9

4,9

7,1

28 184 160

1,2

-7,3

-8,9

1,5

53,8

29 177 162

-5,8

-5,3

30,9

33,5

28,4

30 172 159

-10,8

-8,3

89,9

116,3

69,4

31 183 171

0,2

3,7

0,8

0,0

13,4

32 184 178

1,2

10,7

13,0

1,5

113,8

33 179 167

-3,8

-0,3

1,3

14,3

0,1

34 189 169

6,2

1,7

10,4

38,6

2,8

35 185 157

2,2

-10,3

-22,9

4,9

106,8

36 179 157

-3,8

-10,3

39,1

14,3

106,8

37 174 157

-8,8

-10,3

90,8

77,2

106,8

38 190 162

7,2

-5,3

-38,5

52,0

28,4

39 170 152

-12,8

-15,3

196,0

163,5

235,1

40 176 163

-6,8

-4,3

29,4

46,0

18,8

41 178 161

-4,8

-6,3

30,3

22,9

40,1

42 179 163

-3,8

-4,3

16,4

14,3

18,8

Сумма

7677

7028

0,0

0,0

702,0

1461,1

1673,3

Среднее

182,8

167,3

Таблица 4.4. Вспомогательная таблица для нахождения коэффициента корреляции между ростом сыновей и их матерями.

Рост

d-<d>

f-<f>

(d-<d>)(f-<f>)

(d-<d>)^2

(f-<f>)^2

Дочь (d) Отец (f)
1 172 188

4,1

7,3

29,7

16,6

53,3

2 162 192

-5,9

11,3

-67,0

35,1

127,7

3 160 182

-7,9

1,3

-10,3

62,8

1,7

4 158 179

-9,9

-1,7

16,9

98,5

2,9

5 166 185

-1,9

4,3

-8,3

3,7

18,5

6 177 185

9,1

4,3

39,0

82,4

18,5

7 178 200

10,1

19,3

194,4

101,5

372,5

8 175 198

7,1

17,3

122,4

50,1

299,3

9 173 188

5,1

7,3

37,0

25,8

53,3

10 166 160

-1,9

-20,7

39,8

3,7

428,5

11 160 170

-7,9

-10,7

84,8

62,8

114,5

12 160 182

-7,9

1,3

-10,3

62,8

1,7

13 172 178

4,1

-2,7

-11,0

16,6

7,3

14 162 169

-5,9

-11,7

69,3

35,1

136,9

15 168 183

0,1

2,3

0,2

0,0

5,3

16 159 192

-8,9

11,3

-100,9

79,7

127,7

17 158 175

-9,9

-5,7

56,6

98,5

32,5

18 173 172

5,1

-8,7

-44,2

25,8

75,7

19 165 180

-2,9

-0,7

2,0

8,6

0,5

20 165 173

-2,9

-7,7

22,5

8,6

59,3

21 166 178

-1,9

-2,7

5,2

3,7

7,3

22 169 187

1,1

6,3

6,8

1,2

39,7

23 172 187

4,1

6,3

25,7

16,6

39,7

24 160 172

-7,9

-8,7

68,9

62,8

75,7

25 173 185

5,1

4,3

21,8

25,8

18,5

26 161 178

-6,9

-2,7

18,7

48,0

7,3

27 168 178

0,1

-2,7

-0,2

0,0

7,3

28 174 185

6,1

4,3

26,1

36,9

18,5

29 185 190

17,1

9,3

158,8

291,6

86,5

30 165 172

-2,9

-8,7

25,4

8,6

75,7

31 175 181

7,1

0,3

2,1

50,1

0,1

32 170 181

2,1

0,3

0,6

4,3

0,1

33 164 177

-3,9

-3,7

14,5

15,4

13,7

34 181 178

13,1

-2,7

-35,3

171,0

7,3

35 174 188

6,1

7,3

44,3

36,9

53,3

36 160 178

-7,9

-2,7

21,4

62,8

7,3

37 177 180

9,1

-0,7

-6,4

82,4

0,5

38 162 175

-5,9

-5,7

33,8

35,1

32,5

39 164 171

-3,9

-9,7

38,1

15,4

94,1

40 168 176

0,1

-4,7

-0,4

0,0

22,1

Сумма 6717 7228

0,0

0,0

933,1

1846,8

2544,4

Среднее 167,9 180,7

Таблица 4.5. Вспомогательная таблица для нахождения коэффициента корреляции между ростом дочерей и их отцами.

Рост

d-<d>

m-<m>

(d-<d>)(m-<m>)

(d-<d>)^2

(m-<m>)^2

Дочь (d) Мать (m)
1 172 164

4,1

-2,3

-9,5

16,6

5,4

2 162 162

-5,9

-4,3

25,6

35,1

18,7

3 160 172

-7,9

5,7

-45,0

62,8

32,2

4 158 165

-9,9

-1,3

13,2

98,5

1,8

5 166 160

-1,9

-6,3

12,2

3,7

40,0

6 177 173

9,1

6,7

60,6

82,4

44,6

7 178 168

10,1

1,7

16,9

101,5

2,8

8 175 165

7,1

-1,3

-9,4

50,1

1,8

9 173 163

5,1

-3,3

-16,9

25,8

11,1

10 166 178

-1,9

11,7

-22,5

3,7

136,3

11 160 158

-7,9

-8,3

66,0

62,8

69,3

12 160 168

-7,9

1,7

-13,3

62,8

2,8

13 172 169

4,1

2,7

10,9

16,6

7,2

14 162 152

-5,9

-14,3

84,9

35,1

205,2

15 168 167

0,1

0,7

0,1

0,0

0,5

16 159 146

-8,9

-20,3

181,4

79,7

413,1

17 158 158

-9,9

-8,3

82,6

98,5

69,3

18 173 195

5,1

28,7

145,5

25,8

822,3

19 165 177

-2,9

10,7

-31,2

8,6

114,0

20 165 166

-2,9

-0,3

1,0

8,6

0,1

21 166 167

-1,9

0,7

-1,3

3,7

0,5

22 169 158

1,1

-8,3

-8,9

1,2

69,3

23 172 176

4,1

9,7

39,4

16,6

93,6

24 160 165

-7,9

-1,3

10,5

62,8

1,8

25 173 173

5,1

6,7

33,9

25,8

44,6

26 161 160

-6,9

-6,3

43,8

48,0

40,0

27 168 168

0,1

1,7

0,1

0,0

2,8

28 174 171

6,1

4,7

28,4

36,9

21,9

29 185 175

17,1

8,7

148,1

291,6

75,3

30 165 162

-2,9

-4,3

12,7

8,6

18,7

31 175 161

7,1

-5,3

-37,7

50,1

28,4

32 170 161

2,1

-5,3

-11,0

4,3

28,4

33 164 159

-3,9

-7,3

28,8

15,4

53,7

34 181 180

13,1

13,7

178,8

171,0

187,0

35 174 177

6,1

10,7

64,9

36,9

114,0

36 160 160

-7,9

-6,3

50,1

62,8

40,0

37 177 164

9,1

-2,3

-21,1

82,4

5,4

38 162 161

-5,9

-5,3

31,6

35,1

28,4

39 164 167

-3,9

0,7

-2,6

15,4

0,5

40 168 162

0,1

-4,3

-0,3

0,0

18,7

Сумма 6717 6653

0,0

0,0

1141,0

1846,8

2870,8

Среднее 167,9 166,3

Таблица 4.6. Вспомогательная таблица для нахождения коэффициента корреляции между ростом дочерей и их матерями.

Теперь, зная коэффициенты корреляции, можно проверить, достоверна ли зависимость. Зная коэффициент корреляции, можно найти значение критерия Стьюдента, сравнить с критическим и сделать вывод о достоверности зависимости.

Итак, мы получили, что каждая из зависимостей достоверна. Рост и сыновей  и дочерей зависит от каждого из родителей. Теперь можно написать уравнения регрессии, но прежде, чем мы это сделаем, осмыслим полученный результат.

Мы получили неравенство для параметрических коэффициентов корреляции:

А чем больше коэффициент корреляции (или, что то же самое, чем ближе он к единице, т. к. больше единицы он быть не может), тем сильнее зависимость. Однако можно ли утверждать, что рост сыновей больше зависит от отцов, чем от матерей, а рост дочерей, наоборот, больше зависит от матерей, чем от отцов? Формально нет. Ведь такое неравенство могло получиться случайным образом. По сути, чтобы проверить достоверность этого неравенства, надо высчитывать каждый из коэффициентов несколько раз на основании уже новых опросов, а затем сравнить четыре выборки на принадлежность одной генеральной совокупности. Однако есть основания полагать, что наше неравенство всё же верно без применения критериев: разница между коэффициентами довольно большая (кроме ), а количество степеней свободы велико.

Таким образом, можно дать оценку о том, насколько велик вклад каждого из родителей в рост сына/дочери.

1) Отец - сын (самая сильная зависимость)

2) Мать - дочь (вторая по силе)

3) Мать - сын, отец - дочь (самые слабые, но достоверные зависимости, примерно одинаковые по силе)

 

 

Перейдем к уравнениям регрессии.

Мы получили зависимости между ростом сыновей/дочерей с каждым из родителей. Теперь можно усреднить и получить зависимость роста сыновей/дочерей от обоих родителей, как функцию двух переменных. Итак, имеем

Обратите внимание, что коэффициент перед ростом матери в обоих уравнениях больше, чем перед ростом отцов. Этот результат понятен, кроме того, можно было бы заранее сказать, что так и получится. Почему? Потому что рост матерей в среднем на порядок меньше, чем рост отцов, поэтому, чтобы получить рост сына, рост матери надо помножить на большее число, чем рост отца. Так же и для дочерей. Не должен ввести в заблуждение и следующий образ мыслей: «Так как коэффициент перед ростом матери больше, чем перед ростом отца, то, следовательно, рост как мальчиков, так и девочек больше зависит от матери, чем от отца. С девочками мы уже получили ранее, что это верно, а с мальчиками происходит явное несогласование». На самом деле это неверно, и из величины коэффициента перед ростом матери или отца нельзя сделать выводы о силе связей. Продемонстрируем этот факт на примере.

Пусть имеется следующие данные о росте родителей, рассчитаем ожидаемый рост их сыновей. Рассчитаем параметрический коэффициент корреляции между ростом сыновей и каждым из их родителей Вычисления демонстрировать не будем. При необходимости читатель сам может проверить полученные результаты, ориентируясь на пример выше.

f

m

s(f,m)

200

170

186,8

189

169

184,8

188

168

184,4

187

167

184,1

186

166

183,7

185

165

183,4

184

164

183,0

183

163

182,7

182

162

182,3

181

161

182,0

сумма

1865

1655

1837,1

среднее

186,5

165,5

183,7

 

Видно, что коэффициент корреляция между ростом сыновей и отцов больше, чем между ростом сыновей и матерей.

Осталось только проверить, что при увеличении роста матерей и при уменьшении роста отцов, ожидаемый рост сыновей в среднем увеличится, а для новых коэффициентов корреляции сохранится прежнее неравенство.

Добавим к росту каждой матери 2 см и вычтем 2 см из роста каждого отца, получим:

f

m

s(f,m)

198

172

186,8

187

171

184,9

186

170

184,5

185

169

184,2

184

168

183,8

183

167

183,4

182

166

183,1

181

165

182,7

180

164

182,4

179

163

182,0

сумма

1845

1675

1837,8

среднее

184,5

167,5

183,8

Таким образом, все условия соблюдены. Следовательно, несмотря на то, что в уравнении для ожидаемого роста сына коэффициент перед ростом матери больше, чем пере ростом отца, корреляция между ростом сына и ростом отца сильнее, чем между ростом сына и матери.

Теперь, когда получены уравнения, которые позволят определить наиболее вероятный рост ребенка, возникает новый вопрос: а насколько они полезны? Насколько вероятно сильное отклонение от ожидаемого значения? Для этого определим доверительный интервал, в который войдет рост сыновей/дочерей для определенной доверительной вероятности.

Здесь и - стандартное отклонение. Формула будет иметь несколько хитрый вид, не такой, как обычно, так как мы ищем отклонение не от среднего, а от наиболее вероятного значения, которое зависит от роста каждого из родителей.

Рост

s(f,m)

s-s(f,m)

(s-s(f,m))^2

Сын (s) Отец (f) Мать (m)
1 184 178 170

183,2

0,8

0,59

2 188 182 164

182,7

5,3

28,09

3 185 182 172

184,3

0,7

0,55

4 190 189 172

185,4

4,6

21,34

5 174 170 172

182,3

-8,3

69,56

6 180 170 172

182,3

-2,3

5,48

7 184 183 168

183,6

0,4

0,13

8 195 190 173

185,7

9,3

85,84

9 189 174 170

182,6

6,4

41,09

10 190 185 173

184,9

5,1

25,65

11 189 192 165

184,5

4,5

20,30

12 178 163 168

180,4

-2,4

5,95

13 171 174 168

182,2

-11,2

125,44

14 183 169 170

181,8

1,2

1,46

15 185 188 175

185,8

-0,8

0,65

16 184 182 175

184,8

-0,8

0,71

17 178 170 164

180,8

-2,8

7,73

18 180 178 168

182,8

-2,8

8,07

19 186 186 164

183,3

2,7

7,08

20 189 183 170

184,0

5,0

24,70

21 182 178 160

181,3

0,7

0,52

22 183 180 177

184,9

-1,9

3,67

23 194 180 172

183,9

10,1

101,20

24 180 178 168

182,8

-2,8

8,07

25 187 178 168

182,8

4,2

17,31

26 185 180 182

185,9

-0,9

0,79

27 185 191 170

185,3

-0,3

0,10

28 184 176 160

181,0

3,0

9,24

29 177 172 162

180,7

-3,7

13,76

30 172 177 159

180,9

-8,9

79,66

31 183 178 171

183,4

-0,4

0,18

32 184 177 178

184,6

-0,6

0,40

33 179 176 167

182,3

-3,3

11,06

34 189 182 169

183,7

5,3

28,36

35 185 180 157

181,0

4,0

15,88

36 179 180 157

181,0

-2,0

4,06

37 174 180 157

181,0

-7,0

49,21

38 190 182 162

182,3

7,7

59,14

39 170 178 152

179,7

-9,7

94,48

40 176 181 163

182,3

-6,3

40,26

41 178 175 161

181,0

-3,0

8,97

42 179 182 163

182,5

-3,5

12,29

Сумма

-5,3

1039

Таблица 4.7. Вспомогательная таблица для нахождения стандартного отклонения для наиболее вероятного роста сына.

Рост

d(f,m)

d-d(f,m)

(d-d(f,m))^2

Дочь (d) Отец (f) Мать (m)
1 172 188 164

168

4,0

15,68

2 162 192 162

168,1

-6,1

37,33

3 160 182 172

169,3

-9,3

86,68

4 158 179 165

166,9

-8,9

79,57

5 166 185 160

166,5

-0,5

0,23

6 177 185 173

170,1

6,9

48,30

7 178 200 168

171

7,0

49,00

8 175 198 165

169,9

5,1

26,37

9 173 188 163

167,8

5,2

27,41

10 166 160 178

167,6

-1,6

2,40

11 160 170 158

163,6

-3,6

12,96

12 160 182 168

168,2

-8,2

67,40

13 172 178 169

167,9

4,1

17,10

14 162 169 152

161,8

0,2

0,04

15 168 183 167

168,1

-0,1

0,01

16 159 192 146

163,7

-4,7

22,18

17 158 175 158

164,4

-6,4

40,64

18 173 172 195

174,1

-1,1

1,18

19 165 180 177

170,4

-5,4

28,89

20 165 173 166

166,3

-1,3

1,60

21 166 178 167

167,3

-1,3

1,73

22 169 187 158

166,2

2,8

7,65

23 172 187 176

171,2

0,8

0,66

24 160 172 165

165,8

-5,8

34,05

25 173 185 173

170,1

2,9

8,70

26 161 178 160

165,4

-4,4

19,27

27 168 178 168

167,6

0,4

0,17

28 174 185 171

169,5

4,5

20,25

29 185 190 175

171,4

13,6

185,64

30 165 172 162

165

0,0

0,00

31 175 181 161

166,1

8,9

78,68

32 170 181 161

166,1

3,9

14,98

33 164 177 159

165

-1,0

0,92

34 181 178 180

170,9

10,1

102,21

35 174 188 177

171,6

2,4

5,69

36 160 178 160

165,4

-5,4

29,05

37 177 180 164

166,8

10,2

104,04

38 162 175 161

165,2

-3,2

10,24

39 164 171 167

166,2

-2,2

4,97

40 168 176 162

165,6

2,4

5,62

Сумма

15,1

1199

Таблица 4.8. Вспомогательная таблица для нахождения стандартного отклонения для наиболее вероятного роста дочери.

Итак, получены доверительные интервалы, в которые с вероятностью 0,7 должны войти рост сыновей и дочерей. На основание полученных результатов можно утверждать, что генетика играет ключевую роль в определении роста человека. Без каких-либо дополнительных данных нам удалось подтвердить достоверность зависимости между ростом детей и их родителей, найти уравнения, которые позволяют определить наиболее вероятный рост ребенка и интервал, в который должен войти рост ребенка с вероятностью 0,7. Доверительный интервал получился достаточно узкий. Его можно сделать ещё уже, если учесть влияние других факторов, например, физической нагрузки и питания. Можно найти интервал для любой другой вероятности, использую таблицу критический значений коэффициента Стьюдента (таблица 3.3). Или, наоборот, можно найти вероятностный интервал, в который должен войти рост ребенка при заданном доверительном интервале. Возможность попрактиковаться в этом мы оставим читателю.

Обобщим полученные результаты, чтобы читатель мог легко мог пользоваться ими в своих целях.

Уравнения, который позволят определить наиболее вероятный рост ребенка (первое для сына, второе для дочери).

f - рост отца, m - рост матери.

Интервал, в который должно войти истинное значение роста ребенка с вероятностью 0,7 (первое для сына, второе дл дочери)

Глава 5. «Разрыв поколений» или ещё немного о росте.

В предыдущей главе были представлены данные о росте детей и их родителей. Большинство опрошенных «сыновей» и «дочерей» из одного поколения (20-30 лет), а, значит, можно предположить, что и их родители одного поколения. Как было замечено из предыдущей главы средний рост у матерей меньше, чем у дочерей, а у отцов меньше, чем у сыновей. Возникает вопрос: это случайность или есть достоверное различие между ростом одного и ростом другого поколений? Если различие есть, то можно искать причины этого различия. И тут дело явно не в генетике, а во второстепенных факторах.

Проверим, достоверно ли различие в средних значениях роста у двух поколений. Используем для этого описанный в 3 главе критерий Стьюдента.

Рост

(d-<d>)^2

(m-<m>)^2

(s-<s>)^2

(f-<f>)^2

Дочь (d) Мать (m) Сын (s) Отец (f)
1 172 164 184 178

16,6

5,4

1,0

1,7

2 162 162 188 182

35,1

18,7

25,0

7,3

3 160 172 185 182

62,8

32,2

4,0

7,3

4 158 165 190 189

98,5

1,8

49,0

94,1

5 166 160 174 170

3,7

40,0

81,0

86,5

6 177 173 180 170

82,4

44,6

9,0

86,5

7 178 168 184 183

101,5

2,8

1,0

13,7

8 175 165 195 190

50,1

1,8

144,0

114,5

9 173 163 189 174

25,8

11,1

36,0

28,1

10 166 178 190 185

3,7

136,3

49,0

32,5

11 160 158 189 192

62,8

69,3

36,0

161,3

12 160 168 178 163

62,8

2,8

25,0

265,7

13 172 169 171 174

16,6

7,2

144,0

28,1

14 162 152 183 169

35,1

205,2

0,0

106,1

15 168 167 185 188

0,0

0,5

4,0

75,7

16 159 146 184 182

79,7

413,1

1,0

7,3

17 158 158 178 170

98,5

69,3

25,0

86,5

18 173 195 180 178

25,8

822,3

9,0

1,7

19 165 177 186 186

8,6

114,0

9,0

44,9

20 165 166 189 183

8,6

0,1

36,0

13,7

21 166 167 182 178

3,7

0,5

1,0

1,7

22 169 158 183 180

1,2

69,3

0,0

0,5

23 172 176 194 180

16,6

93,6

121,0

0,5

24 160 165 180 178

62,8

1,8

9,0

1,7

25 173 173 187 178

25,8

44,6

16,0

1,7

26 161 160 185 180

48,0

40,0

4,0

0,5

27 168 168 185 191

0,0

2,8

4,0

136,9

28 174 171 184 176

36,9

21,9

1,0

10,9

29 185 175 177 172

291,6

75,3

36,0

53,3

30 165 162 172 177

8,6

18,7

121,0

5,3

31 175 161 183 178

50,1

28,4

0,0

1,7

32 170 161 184 177

4,3

28,4

1,0

5,3

33 164 159 179 176

15,4

53,7

16,0

10,9

34 181 180 189 182

171,0

187,0

36,0

7,3

35 174 177 185 180

36,9

114,0

4,0

0,5

36 160 160 179 180

62,8

40,0

16,0

0,5

37 177 164 174 180

82,4

5,4

81,0

0,5

38 162 161 190 182

35,1

28,4

49,0

7,3

39 164 167 170 178

15,4

0,5

169,0

1,7

40 168 162 176 181

0,0

18,7

49,0

2,9

Сумма

6717

6653

7320

7172

1847

2871

1422

1514

Среднее

167,9

166,3

183,0

179,3

Таблица 5.1. Вспомогательная таблица для нахождения критерия Стьюдента

В таблице 5.1 Мать - это мать дочери, а Отец - отец сына, других родственных связей здесь нет. Однако это никак не повлияет на результаты, нас не интересуют родственные связи совсем, только рост у людей разных поколений. Просто данные взяты из главы 4.

Будем искать два значения критерия: для выборок «мать-дочь» и «отец-сын».

Нулевая гипотеза: различие в росте у двух представленных поколений недостоверно.

Важное замечание. Критическое значение мы брали для α=0,01, то есть вероятность того, что мы ошибочно отвергли (приняли) нулевую гипотезу меньше 0,01. Однако мы делали вывод о принятии нулевой гипотезы дважды, поэтому вероятность хоть раз ошибиться на самом деле меньше α’

Получили истинный уровень значимости. Теперь осмыслим полученный результат.

Достоверно различие в росте только у мужчин. Значит, в последнее время изменения в жизни мужчин происходили более резкие, чем у женщин. Возможно, однако, и другое объяснение: данные о росте нам предоставляли сыновья и дочери, а так как «быть выше» все равно, что «быть круче», особенно среди мужчин, сыновья могли, возможно, неосознанно завышать свой рост. Завышения оказалось незначительным, но при таком большом количестве опрошенных его можно отследить. Возможность докопаться до истины в данном вопросе мы предоставим читателю. Мне, например, второе объяснение кажется более вероятным. И если я прав, то анализ в этой главе может послужить примером, как статистическими методами могут пользоваться в психологии. В свою очередь это опять подтверждает, что статистика может решать задачи абсолютно различные на вкус и цвет…


Дата добавления: 2018-08-06; просмотров: 161; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!