Пример подбора эмпирической модели

Лабораторная работа № 2   Подбор Эмпирических Моделей С Двумя Параметрами   Цель работы: освоить простейшие приемы построения и проверки на адекватность эмпирических формул. Изучить применение критерия Стъюдента к линейным и нелинейным моделям. Порядок выполнения работы. 1. Изучить предложенный ниже материал. 2. Выполнить индивидуальное задание. 3. Представить отчет, который включает описание задачи, метод ее решения и анализ результатов. 4. Защитить выполненную работу.  

Основные теоретические положения

Математическая модель называется аналитической, если ее уравнения и соотношения получены путем теоретических выкладок, если же они получены в результате обработки опытных данных, то такая модель называется эмпирической.

Математические модели по числу аргументов (факторов), от которых зависит значение функции, делятся на однофакторные ( y = f 1 ( x ) ) и многофакторные ( y = f ( x 1 , x 2 ,…, xn ) ).

Однофакторные модели по своему описанию делятся на линейные (описываемые уравнением прямой линии) и нелинейные (описываемые уравнениями других видов - гиперболические, экспоненциальные, показательные, полиномиальные и др.).

Эмпирические модели по числу параметров, значения которых необходимо определить в уравнении, описывающем модель, делятся на:

- однопараметрические (y = ax , y = aex , y = xb и т.д.);

- двухпараметрические (y = a + bx , e = aebx , y = axb и т.п.);

- многопараметрические (y = a + bx + cx 2 и т.д. )

В приведенных выше примерах a , b и c представляют собой параметры эмпирических моделей.

При решении многих задач из области сельскохозяйственного производства для построения модели часто используются опытные данные, т. е. возникает задача подбора эмпирических моделей.

Простейшим видом эмпирической модели с двумя параметрами, используемой для аппроксимации результатов экспериментов, является линейная модель:

 

у = а + bх,                                                                                                     (1)

 

где а и b - параметры модели.

Графически уравнение (1) представляет собой прямую линию на плоскости. Однако очень часто линейная модель не удовлетворяет результатам экспериментальных исследований зависимости Y от X. В этом случае в качестве эмпирической модели можно использовать нелинейные модели y=f(x,a,b), которые также содержат два параметра а и b. Наиболее часто используемые из них, представлены на рис.1. Задача нахождения параметров этих моделей по результатам экспериментов решается с помощью метода наименьших квадратов

 

Метод наименьших квадратов для линейных моделей

Пусть в экспериментальных исследованиях проведено n опытов (измерений), в результате которых в табличном виде получены зависимость величины У от Х Допустим, что при нанесении табличных данных на координатную сетку Х-У все экспериментальные данные ложатся вблизи прямой линии Из этого следует, что в первом приближении в качестве модели можно использовать линейную модель (1), в которой необходимо определить значения параметров а и b.


                                                       Рисунок 1.

 

Сущность метода наименьших квадратов заключается в таком подборе параметров а и b, чтобы сумма S квадратов невязок модели была минимальной:

                                                                       (2)

где i=1...n - порядковый номер опыта; Ei=yi-ymi - невязка модели для i-го опыта, под которой понимается разность между значением yi, полученным в опыте, и значением ymi, рассчитанным по модели после подстановки в нее соответствующего xi.

Для линейной модели (1) невязка определяется по формуле:

 

Ei = yi – ( a + bxi )                                                                           (3)

 

Таким образом:

                                                    (4)

Здесь и далее знак   обозначает .

Из (4) видно, что сумма S зависит от параметров а и b, т. е. S=f(а,b). Из курса высшей математики известно, что если частные производные функции нескольких независимых аргументов в какой-либо точке равны нулю, то сама функция в этой точке имеет экстремум. Поэтому продифференцируем уравнение (4), считая а и b независимыми аргументами функции S, и полученные частные производные   и  приравняем к нулю. В результате получаем систему уравнений:

             

                                                               (5)

Раскрыв в системе (5) скобки и опустив для удобства записей индексы (i) при переменных Х и У, получаем:

                                                                                      (6)

Из первого уравнения системы (6) выразим а:

                                                                                  (7)

Подставим (7) во второе уравнение системы (6) и выразим b:

 (8)

Таким образом, для определения параметров a и b линейной модели (1) методом наименьших квадратов необходимо по формуле (8) рассчитать значение b, а затем по формуле (7) - значение а.

Следует заметить, что все проведенные выкладки справедливы только для линейной модели (1). Если же используется какая-либо нелинейная модель (рис.1), то ее предварительно необходимо линеаризовать (привести к линейному виду), что позволит вычислять параметры этих моделей, не находя их частных производных, т.е. упростит расчеты.

 

Линеаризация нелинейных моделей.

Процесс линеаризации нелинейных моделей y=f (х,а,b) с двумя параметрами заключается в приведении ее путем замены переменных к линейному виду:

 

u = c + dz                                                                                              (9)

Замена переменных может быть произведена следующим образом:

u = f1 (x, y)                                                                                           (10)

z = f2 (x)                                                                                      (11)

c = f3 (a, b)                                                                                           (12)

d = f4 (а, b )                                                                                           (13)

 

Выражения (10)...(13) называются линеаризующими преобразованиями для исходной нелинейной модели.

Если нелинейную модель y=f(x,a,b) удается привести к виду (9), то параметры с и d можно рассчитать по формулам, аналогичным (7) и (8), т.е.:

                                                                      (14)

                                                                             (15)

После определения с и d по этим формулам остается из уравнений (12) и (13) найти значение параметров а и b для исходной нелинейной модели.

 

Пример 1. Модель на основе показательной функции.

 

y = ab–x                                                                                                       (16)

 

Прологарифмируем (16)

 

ln ( y ) = ln ( a ) – xln ( b )                                                                               (17)

 

Сравнивая (17) и (9), можем записать, что линеаризующие преобразования для этой модели будут:

 

u = ln(y), z = x                                                                                       (18)

c = ln(a), d = –ln(b)                                                                                   (19)

Таким образом, u и z расчитываются по таблице исходных данных с помощью формул (18), а параметры линеаризованной модели c и d по формулам (14) и (15). Затем по (19) можно определить:

            a = ec и b = e d                                                                         (19а)

 

Можно сразу определить a и b из (14) (15), подставив в них (18):

 

Пример 2. Рассмотрим модель:

                                                                                               (20)

"Перевернем" обе части (20), получим:

                                                                             (21)

Сравнивая (21) с (9), получаем, что

Далее поступаем, как и в предыдущем примере.

Аналогично проводится линеаризация любой нелинейной модели y = f (x,a,b) с двумя параметрами. Если она проведена правильно, то график исходной нелинейной модели, построенный в координатах Z - U, будет представлять собой прямую линию.

 

Оценка соответствия эмпирической модели экспериментальным данным.

Эмпирическая модель называется адекватной, если она с достаточной степенью точности описывает экспериментальные данные. Для количественной оценки адекватности эмпирической модели применяют различные показатели, мы будем использовать:  

- коэффициент корреляции R;

- коэффициент детерминации D ;

- критерий Стьюдента T;

- среднеквадратическую ошибку So.

- критерий Фишера F;  

Критерий Фишера используется для оценки адекватности эмпирической модели в том случае, когда в экспериментах при каждом значении X проводилось несколько повторных опытов по измерению Y. Подробно критерий Фишера будет рассмотрен в следующей лабораторной работе.

Остальные критерии используются и при наличии повторных опытов, и без них.

Коэффициент корреляции R рассчитывается по формуле

                                         (22)

и количественно оценивает степень линейной зависимости между величинами X и Y, поэтому его корректное использование возможно только для линейной модели (1). 

Если используется какая-либо нелинейная модель (рис. 1), то ее необходимо предварительно преобразовать к линейному виду (9), а затем уже вычислять коэффициент корреляции R по формуле (22), заменив в ней X и У на Z и U соответственно.

Рассчитанное таким образом значение коэффициента корреляции может находиться в пределах R = -1...+1. 

Если получено |R|>1 это свидетельствует о том, что при расчете по формуле (22) допущена ошибка.

В зависимости от величины коэффициента корреляции R мо­гут быть сделаны следующие выводы:

а) |R| = 1 - между величинами X и У наблюдается строгая линейная связь. Если R рассчитано для линеаризованной модели (9), то это означает, что между Z и U наблюдается строгая линейная связь. Но поскольку модель (9) получена путем линеаризации некоторой нелинейной модели, то исходная нелинейная модель адекватна.

б) R = 0 - между величинами X и Y (Z и U) полностью отсутствует линейная связь, следовательно, исследуемая модель неадекватна. Однако следует помнить, что значение R=0 отвергает отсутствие именно линейной связи между исследуемыми величинами, но вполне возможно, что между ними существует какая-то другая зависимость.

в) |R| >= 0.7 - велика вероятность того, что связь между величи­нами Х и У (Z и U) близка к линейной. Поэтому исследуемая модель с большой степенью вероятности является адекватной. Однако окончательный вывод об адекватности модели можно сделать после дополнительной проверки достоверности значения R по критерию Стьюдента.

г) |R| < 0.7 - вероятность того, что связь между величинами X и У (Z и U) близка к линейной, недостаточна для заключения об адекватности модели. Скорее всего, модель неадекватна. Однако окончательный вывод можно сделать только после подтверждения достоверности значения R с помощью критерия Стьюдента.

Величина D = R2 называется коэффициентом детерминации и показывает, какая доля суммы квадратов невязок (отклонений опытных данных, от рассчитанных по модели) объясняется линейной зависимостью Y от X (U от Z). Например, если D = 0.81 (при этом |R| = 0.9), то 81 % невязок объясняется линейной зависимостью Y от X, а 19 % - либо нелинейной зависимостью, либо грубыми ошибками эксперимента. Поэтому при |R| < 0.7 коэффициент детерминации D < 0.5, т.е. менее 50 % невязок объясняется линейной зависимостью, и нет оснований для признания модели адекватной.

Критерий Стьюдента Т используется для оценки достоверности рассчитанного значения коэффициента корреляции R и определяется по формуле:

                                                                                        (23)

Для того, чтобы с доверительной вероятностью р% признать зна­чение коэффициента корреляции R достоверным, необходимо, чтобы выполнялось условие:

 

Т > Тk (р, ν),                                                                                             (24)

 

где Тк (р, ν) - критическое значение критерия Стьюдента (табл.1) для доверительной вероятности p при числе степеней свободы ν, зависящей от числа опытов: ν = n-2.

Для расчетов, связанных с сельскохозяйственными задачами, рекомендуется принимать р = 0.95 (или 95%).

Анализ уравнения (23) и данных табл.1 показывает, что c увеличением числа опытов n значение Т увеличивается, а Тk(р,ν) - уменьшается, следовательно растет достоверность значения R.

Таким образом, если доказана достоверность коэффициента корреляции, то при |R| > 0.7 эмпирическую модель следует считать адекватной, а при |R| < 0.7 - неадекватной.

  Таблица 1. Критические значения критерия Стъюдента Tk ( p ,ν)

Число сте-

пеней сво-

боды ν= n -2

Доверительная вероятность р, %

90 95 99 99.9
1 6.314 12.71 63.66 636.6
2 2.920 4.303 9.925 31.60
3 2.353 3.182 5.841 12.92
4 2.132 2.776 4.604 8.610
5 2.015 2.571 4.032 6.869
6 1.943 2.447 3.707 5.959
7 1.895 2.365 3.499 5.408
8 1.860 2.306 3.355 5.041
9 1.833 2.262 3.250 4.781
10 1.812 2.228 3.169 4.587
12 1.782 2.179 3.055 4.318
14 1.761 2.145 2.977 4.140
16 1.746 2.120 2.921 4.015
18 1.734 2.101 2.878 3.922
20 1.725 2.086 2.845 3.850
22 1.717 2.074 2.819 3.792
24 1.711 2.064 2.797 3.745
26 1.706 2.056 2.779 3.707
30 1.697 2.042 2.750 3.646
40 1.684 2.021 2.704 3.551
50 1.676 2.009 2.678 3.496
100 1.660 1.984 2.626 3.390
200 1.653 1.972 2.601 3.340
500 1.648 1.965 2.586 3.310
1.645 1.960 2.576 3.291

Если достоверность R не доказана, то необходимо повторить эксперименты, но с большим числом опытов n.

Погрешность эмпирической модели оценивается с помощью величины, которая называется среднеквадратической ошибкой , показывает среднее значение невязок модели и рассчитывается по формуле:

 

                                                                                            (25)

 

Алгоритм подбора эмпирических моделей с двумя параметрами

Обобщая все изложенное выше, можно предложить следующую последовательность действий (алгоритм) для подбора по результатам экспериментов эмпирических моделей с двумя параметрами.       

1. Экспериментальные данные y=f (х) нанести в виде точек на координатную плоскость X-Y и предварительно оценить вид эмпирической модели. Если экспериментальные точки ложатся вблизи прямой линии, то принимается линейная модель (1), в противном случае, выбирается одна или несколько нелинейных моделей (рис.1).

2. Для нелинейных моделей путем замены переменных провести линеаризацию. Правильность линеаризации можно проконтролировать путем нанесения экспериментальных точек на координатную плоскость Z-U, где они должны ложиться вблизи прямой линии.

3. По формулам (14) и (15) рассчитать параметры с и d для линеаризованной модели (9), а затем, используя линеаризующие преобразования (12) и (13) - параметры а и b для исходной модели.

4. По формулам (22), (23) и (25) рассчитать коэффициент корреляции R, критерий Стьюдента Тк и среднеквадратическую ошибку . Задавшись доверительной вероятностью р%, определить с помощью стандартной функции, или по таблице 1, критическое значение критерия Стьюдента Тk (p,ν) и проверить достоверность R  по условию (24).

 

, где Р – доверительная вероятность, например, если Р = 0.95, то , если Р = 0.9, то р = 0.95 и т.д.

 

5. Если коэффициент корреляции достоверен (Т >= Тk ), то по величине R вынести заключение об адекватности принятой эмпирической модели. В противном случае проведенных опытов недостаточно для какого-либо заключения об адекватности эмпирической модели.

6. Ecли адекватными оказались несколько предварительно выбранных моделей, то окончательно в качестве эмпирической модели принимается та, у которой среднеквадратическая ошибка окажется минимальной.

 

Пример подбора эмпирической модели

Пусть в результате исследования процессов просеивания получена следующая зависимость схода непросеянной смеси Y (ц) от амплитуды встряхивания X (см).

 

Результаты экспериментальных исследований:

№опыта 1 2 3 4 5 6 7
X 0.5 1.0 1.5 2.0 2.5 3.0 3.5
Y 4.0 2.0 1.5 1.0 0.9 0.6 0.5

 

 

Дальнейшие действия выполним, используя EXCEL:

 

 

На рис.2 представлен результат. Изучая расположение точек, можно предположить, что подойдут кривые похожие на обычную гиперболу . Поэтому в качестве моделей выберем две функции: (16) и (20). Проверим их на адекватность и сравним по точности. Линеаризация этих функций выполнена выше.

 

Таблица 2. Пример подбора линейной эмпирической модели в пакете Excel:

  A B C D E F
1   x y xy x2 yp
2 1 0,5 4      
3 2 1 2      
4 3 1,5 1,5      
5 4 2 1      
6 5 2,5 0,9      
7 6 3 0,6      
8 7 3,5 0,5      
9            
10            
11   b=        
12   a=        

 

D2) =B2*C2

D2 à D3..D8

E2) =B2^2

E2 à E3..E8

B9) =СУММ(B2:B8)

C9) =СУММ(C2:C8)

D9) =СУММ(D2:D8)

E9) =СУММ(E2:E8)

 

C11) =(A8*D9-B9*C9)/(A8*E9-B9^2)

 

C12) =(C9-C11*B9)/A8

 

F2) =C$12+C$11*B2

F2 à F3..F8

 

Таблица 3.

  A B C D E F
1   x y xy x2 yp
2 1 0,5 4 2 0,25 2,989286
3 2 1 2 2 1 2,492857
4 3 1,5 1,5 2,25 2,25 1,996429
5 4 2 1 2 4 1,5
6 5 2,5 0,9 2,25 6,25 1,003571
7 6 3 0,6 1,8 9 0,507143
8 7 3,5 0,5 1,75 12,25 0,010714
9     10,5 14,05 35  
10            
11   b= -0,99286      
12   a= 3,485714      

 

Для построения графиков выделим блок ячеек (B2–C8 Ctrl F2..F8) и вызовем «Мастер диаграмм». На вкладке «Стандартные» выберем тип диаграммы – «Точечная» и вид – «Точечная диаграмма со значениями, соединенными сглаживающими линиями» (средняя в первом столбце). Руководствуясь указаниями «Мастера диаграмм», построим график и расположим диаграмму на одном листе вместе с результатами расчета (рисунок *).

 


Рисунок 3.

 

 

Пример подбора нелинейной эмпирической модели y = ab–x  в пакете Excel:

 

 

Таблица 4.

  A B C D E
1 Nоп x yt  
2 1 0,5 4    
3 2 1 2    
4 3 1,5 1,5    
5 4 2 1    
6 5 2,5 0,9    
7 6 3 0,6    
8 7 3,5 0,5    
9          
10          
11     a= 1  
12     b= 2  
13     Xz= 2,1  
14     Yr=    

 

D2) =D$11*D$12^-B2

D2 à D3..D8

E2) =(C2-D2)^2

E2 à E3..E8

E9) =СУММ(E2:E8)

D14) =D$11*D$12^-D13

 

Таблица 5.

  A B C D E
1 Nоп x yt  
2 1 0,5 4 0,707107 10,84315
3 2 1 2 0,5 2,25
4 3 1,5 1,5 0,353553 1,31434
5 4 2 1 0,25 0,5625
6 5 2,5 0,9 0,176777 0,523052
7 6 3 0,6 0,125 0,225625
8 7 3,5 0,5 0,088388 0,169424
9         15,88809
10          
11     a= 1  
12     b= 2  
13     Xz= 2,1  
14     Yr= 0,233258  

 

Затем открываем “Поиск решения” (раздел ‹‹Сервис›› главного меню MS Office 1997-2003 или вкладка ‹‹Данные›› на ленте MS Office 2007-2010) формируем условие оптимизации (минимум целевой функции в ячейке E9) и параметры оптимизации (ячейки изменения D11:D12). После чего проводим запуск на выполнение оптимизации.

Рисунок 4.

 

В результате оптимизации получим таблицу 6.

  A B C D E
1 Nоп x yt  
2 1 0,5 4 3,758093 0,058519
3 2 1 2 2,434561 0,188844
4 3 1,5 1,5 1,577153 0,005953
5 4 2 1 1,021709 0,000471
6 5 2,5 0,9 0,661882 0,0567
7 6 3 0,6 0,428779 0,029317
8 7 3,5 0,5 0,277771 0,049386
9         0,389189
10          
11     a= 5,801154  
12     b= 2,382833  
13     Xz= 2,1  
14     Yr= 0,936737  

 

Для построения графиков выделим блок ячеек B2–D8 и вызовем «Мастер диаграмм». На вкладке «Стандартные» выберем тип диаграммы – «Точечная» и вид – «Точечная диаграмма со значениями, соединенными сглаживающими линиями» (средняя в первом столбце). Руководствуясь указаниями «Мастера диаграмм», построим график и расположим диаграмму на одном листе вместе с результатами расчета (рисунок 6).

 

Рисунок 5.

 


Пример линеаризации нелинейной модели y = ab–x в пакете Excel:

Таблица 6.

  A B C D E F G H I
1   x y z u zu z2 yp  
2 1 0,5 4            
3 2 1 2            
4 3 1,5 1,5            
5 4 2 1            
6 5 2,5 0,9            
7 6 3 0,6            
8 7 3,5 0,5            
9                  
10                  
11   d=     b=     R=  
12   c=     a=     T=  
13               S0=  

 

 

D2) =B2

D2 à D3..D8

E2) =LN(C2)

E2 àE3..E8

F2) =D2*E2

F2 à F3..F8

G2) =D2^2

G2 à G3..G8

D9) =СУММ(D2:D8)

E9) =СУММ(E2:E8)

F9) =СУММ(F2:F8)

G9) =СУММ(G2:G8)

 

(A1)

C11) =(A8*F9-D9*E9)/(A8*G9-D9^2)

 

(A0)

C12) =(E9-C11*D9)/A8

 

F11) =EXP(-C11)            (b)

F12) =EXP(C12)             (a)

H2) =F$12*F$11^(-B2)

H2 à H3..H8

I2) =(C2-H2)^2

I2 à I3..I8

I9) =СУММ(I2:I8)

I11) =КОРРЕЛ(B2:B8;H2:H8)

 

I12) =(ABS(I11)*КОРЕНЬ(A8-2))/КОРЕНЬ(1-I11*I11)

I13) =КОРЕНЬ(I9/A8)

 

Таблица 7.

  A B C D E F G H I
1   x y z u zu z2 yp  
2 1 0,5 4 0,5 1,386294 0,693147 0,25 3,155214 0,7136627
3 2 1 2 1 0,693147 0,693147 1 2,275085 0,0756716
4 3 1,5 1,5 1,5 0,405465 0,608198 2,25 1,640462 0,0197297
5 4 2 1 2 0 0 4 1,182865 0,0334394
6 5 2,5 0,9 2,5 -0,10536 -0,2634 6,25 0,852911 0,0022174
7 6 3 0,6 3 -0,51083 -1,53248 9 0,614996 0,0002249
8 7 3,5 0,5 3,5 -0,69315 -2,42602 12,25 0,443446 0,0031983
9       14 1,175573 -2,2274 35   0,848144
10                  
11   d= -0,65408   b= 1,923369   R= -0,9637953
12   c= 1,476096   a= 4,375827   T= 8,082381
13               S0= 0,3480854

 

 

Для построения графиков выделим блок ячеек (B2–C8 Ctrl H2..H8) и вызовем «Мастер диаграмм». На вкладке «Стандартные» выберем тип диаграммы – «Точечная» и вид – «Точечная диаграмма со значениями, соединенными сглаживающими линиями» (средняя в первом столбце). Руководствуясь указаниями «Мастера диаграмм», построим график и расположим диаграмму на одном листе вместе с результатами расчета (рисунок *).


 

Контрольные вопросы

1. Понятие эмпирических моделей?

2. Сущность метода наименьших квадратов?

3. Линеаризация нелинейных моделей. Как получить формулы для расчета параметров линеаризованной модели?

4. Как проверить правильность линеаризации?

5. Понятие адекватности эмпирической модели и количественные показатели для ее оценки?

6. Что характеризует коэффициент корреляции?

7. Для каких моделей применим коэффициент корреляции?

8. В каких пределах может меняться коэффициент корреляции, и какие выводы можно сделать по его величине?

9. Что такое коэффициент детерминации, и как он вычисляется?

10. Понятие критерия Стъюдента, от чего зависит его критическая (табличная) величина?

11. При выполнении каких условий эмпирическую модель можно считать адекватной?

12. В каких случаях нельзя сделать достоверный вывод об адекватности модели?

13. Как оценить погрешность эмпирической модели?

14. Перечислить и охарактеризовать встретившиеся функции EXCEL.

 

 


Дата добавления: 2019-02-12; просмотров: 794; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!