Для какого описания используется распределение Лапласа



Распределение Лапласа можно использовать для описания логарифмов относительного изменения цен активов, зачастую с большим успехом, чем нормальное распределение. Распределе́ние Лапла́са (двойно́е экспоненциа́льное) — в теории вероятностей это непрерывное распределение случайной величины. Случайная величина имеет распределение Лапласа (двустороннее экспоненциальное распределение) с параметром и , если ее функция плотности вероятностей имеет вид:

Распределение применяется для моделирования обработки сигналов, в моделировании биологических процессов (когда другие распределения совсем не подогнать), экономике и финансах. Распределение можно применить к:

кредитным рискам

страховым случаям

при работе с фильтром Кальмана

23 Какие задачи выполняет Matlab. MATLAB (сокращение от англ. «Matrix Laboratory», в русском языке произносится как Матла́б) — пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете. Пакет используют более миллиона инженерных и научных работников, он работает на большинстве современных операционных систем, включая Linux, Mac OS, Solaris (начиная с версии R2010b поддержка Solaris прекращена[5]) и Windows[6]. MATLAB как язык программирования был разработан Кливом Моулером (англ. Cleve Moler) в конце 1970-х годов когда он был деканом факультета компьютерных наук в Университете Нью-Мексико. Целью разработки служила задача дать студентам факультета возможность использования программных библиотек Linpack и EISPACK без необходимости изучения Фортрана. Вскоре новый язык распространился среди других университетов и был с большим интересом встречен учёными, работающими в области прикладной математики. До сих пор в Интернете можно найти версию 1982 года, написанную на Фортране, распространяемую с открытым исходным кодом. Инженер Джон Литтл (англ. John N. (Jack) Little) познакомился с этим языком во время визита Клива Моулера в Стэнфордский университет в 1983 году. Поняв, что новый язык обладает большим коммерческим потенциалом, он объединился с Кливом Моулером и Стивом Бангертом (англ. Steve Bangert). Совместными усилиями они переписали MATLAB на C и основали в 1984 компанию The MathWorks для дальнейшего развития. Эти переписанные на С библиотеки долгое время были известны под именем JACKPAC. Первоначально MATLAB предназначался для проектирования систем управления (основная специальность Джона Литтла), но быстро завоевал популярность во многих других научных и инженерных областях. Он также широко использовался и в образовании, в частности, для преподавания линейной алгебры и численных методов. MATLAB предоставляет пользователю большое количество (несколько сотен) функций для анализа данных, покрывающие практически все области математики, в частности:

Матрицы и линейная алгебра — алгебра матриц, линейные уравнения, собственные значения и векторы, сингулярности, факторизация матриц и другие.

Многочлены и интерполяция — корни многочленов, операции над многочленами и их дифференцирование, интерполяция и экстраполяция кривых и другие.

Математическая статистика и анализ данных — статистические функции, статистическая регрессия, цифровая фильтрация, быстрое преобразование Фурье и другие.

Обработка данных — набор специальных функций, включая построение графиков, оптимизацию, поиск нулей, численное интегрирование (в квадратурах) и другие.

Дифференциальные уравнения — решение дифференциальных и дифференциально-алгебраических уравнений, дифференциальных уравнений с запаздыванием, уравнений с ограничениями, уравнений в частных производных и другие.

Разреженные матрицы — специальный класс данных пакета MATLAB, использующийся в специализированных приложениях.

Целочисленная арифметика — выполнение операций целочисленной арифметики в среде MATLAB. Для MATLAB имеется возможность создавать специальные наборы инструментов (англ. toolbox), расширяющие его функциональность. Наборы инструментов представляют собой коллекции функций, написанных на языке MATLAB для решения определённого класса задач. Компания Mathworks поставляет наборы инструментов, которые используются во многих областях, включая следующие:

 

Цифровая обработка сигналов, изображений и данных: DSP Toolbox, Image Processing Toolbox, Wavelet Toolbox, Communication Toolbox, Filter Design Toolbox — наборы функций, позволяющих решать широкий спектр задач обработки сигналов, изображений, проектирования цифровых фильтров и систем связи.

Системы управления: Control Systems Toolbox, µ-Analysis and Synthesis Toolbox, Robust Control Toolbox, System Identification Toolbox, LMI Control Toolbox, Model Predictive Control Toolbox, Model-Based Calibration Toolbox — наборы функций, облегчающих анализ и синтез динамических систем, проектирование, моделирование и идентификацию систем управления, включая современные алгоритмы управления, такие как робастное управление, H∞-управление, ЛМН-синтез, µ-синтез и другие.

Финансовый анализ: GARCH Toolbox, Fixed-Income Toolbox, Financial Time Series Toolbox, Financial Derivatives Toolbox, Financial Toolbox, Datafeed Toolbox — наборы функций, позволяющие быстро и эффективно собирать, обрабатывать и передавать различную финансовую информацию.

Анализ и синтез географических карт, включая трёхмерные: Mapping Toolbox.

Сбор и анализ экспериментальных данных: Data Acquisition Toolbox, Image Acquisition Toolbox, Instrument Control Toolbox, Link for Code Composer Studio — наборы функций, позволяющих сохранять и обрабатывать данные, полученные в ходе экспериментов, в том числе в реальном времени. Поддерживается широкий спектр научного и инженерного измерительного оборудования.

Визуализация и представление данных: Virtual Reality Toolbox — позволяет создавать интерактивные миры и визуализировать научную информацию с помощью технологий виртуальной реальности и языка VRML.

Средства разработки: MATLAB Builder for COM, MATLAB Builder for Excel, MATLAB Builder for NET, MATLAB Compiler, Filter Design HDL Coder — наборы функций, позволяющих создавать независимые приложения из среды MATLAB.

Взаимодействие с внешними программными продуктами: MATLAB Report Generator, Excel Link, Database Toolbox, MATLAB Web Server, Link for ModelSim — наборы функций, позволяющие сохранять данные различных видов таким образом, чтобы другие программы могли с ними работать.

Базы данных: Database Toolbox — инструменты работы с базами данных.

Научные и математические пакеты: Bioinformatics Toolbox, Curve Fitting Toolbox, Fixed-Point Toolbox, Fuzzy Logic Toolbox, Genetic Algorithm and Direct Search Toolbox, OPC Toolbox, Optimization Toolbox, Partial Differential Equation Toolbox, Spline Toolbox, Statistic Toolbox, RF Toolbox — наборы специализированных математических функций, позволяющие решать широкий спектр научных и инженерных задач, включая разработку генетических алгоритмов, решения задач в частных производных, целочисленные проблемы, оптимизацию систем и другие.

Нейронные сети: Neural Network Toolbox — инструменты для синтеза и анализа нейронных сетей.

Нечёткая логика: Fuzzy Logic Toolbox — инструменты для построения и анализа нечётких множеств.

Символьные вычисления: Symbolic Math Toolbox — инструменты для символьных вычислений с возможностью взаимодействия с символьным процессором программы Maple.

Помимо вышеперечисленных, существуют тысячи других наборов инструментов для MATLAB, написанных другими компаниями и энтузиастами.

24 Укажите функциональные особенности программных средств для анализа данных. Data mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пятецким-Шапиро в 1989 году[1][2][3].

 

Английское словосочетание «data mining» пока не имеет устоявшегося перевода на русский язык. При передаче на русском языке используются следующие словосочетания[4]: просев информации, добыча данных, извлечение данных, а также интеллектуальный анализ данных[5][6][7]. Более полным и точным является словосочетание «обнаружение знаний в базах данных» (англ. knowledge discovery in databases, KDD).

Основу методов data mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики. К методам data mining нередко относят статистические методы (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов, анализ выживаемости, анализ связей). Такие методы, однако, предполагают некоторые априорные представления об анализируемых данных, что несколько расходится с целями data mining (обнаружение ранее неизвестных нетривиальных и практически полезных знаний).

Одно из важнейших назначений методов data mining состоит в наглядном представлении результатов вычислений (визуализация), что позволяет использовать инструментарий data mining людьми, не имеющими специальной математической подготовки.

 

Применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой. Первоначально задача ставится следующим образом:

имеется достаточно крупная база данных;

предполагается, что в базе данных находятся некие «скрытые знания».

Необходимо разработать методы обнаружения знаний, скрытых в больших объёмах исходных «сырых» данных. В текущих условиях глобальной конкуренции именно найденные закономерности (знания) могут быть источником дополнительного конкурентного преимущества.

Что означает «скрытые знания»? Это должны быть обязательно знания:

ранее неизвестные — то есть такие знания, которые должны быть новыми (а не подтверждающими какие-то ранее полученные сведения);

нетривиальные — то есть такие, которые нельзя просто так увидеть (при непосредственном визуальном анализе данных или при вычислении простых статистических характеристик);

практически полезные — то есть такие знания, которые представляют ценность для исследователя или потребителя;

доступные для интерпретации — то есть такие знания, которые легко представить в наглядной для пользователя форме и легко объяснить в терминах предметной области.

Эти требования во многом определяют суть методов data mining и то, в каком виде и в каком соотношении в технологии data mining используются системы управления базами данных, статистические методы анализа и методы искусственного интеллекта. Методы data mining могут быть применены как для работы с большими данными, так и для обработки сравнительно малых объемов данных (полученных, например, по результатам отдельных экспериментов, либо при анализе данных о деятельности компании)[источник не указан 695 дней]. В качестве критерия достаточного количества данных рассматривается как область исследования, так и применяемый алгоритм анализа[источник не указан 695 дней].

Развитие технологий баз данных сначала привело к созданию специализированного языка — языка запросов к базам данных. Для реляционных баз данных — это язык SQL, который предоставил широкие возможности для создания, изменения и извлечения хранимых данных. Затем возникла необходимость в получении аналитической информации (например, информации о деятельности предприятия за определённый период), и тут оказалось, что традиционные реляционные базы данных, хорошо приспособленные, например, для ведения оперативного учёта на предприятии, плохо приспособлены для проведения анализа. Это привело, в свою очередь, к созданию т. н. «хранилищ данных», сама структура которых наилучшим способом соответствует проведению всестороннего математического анализа.

25 Что является целью планирования эксперимента в научных исследованиях. Планирование эксперимента (англ. experimental design techniques) — комплекс мероприятий, направленных на эффективную постановку опытов. Основная цель планирования эксперимента — достижение максимальной точности измерений при минимальном количестве проведенных опытов и сохранении статистической достоверности результатов.

Планирование эксперимента применяется при поиске оптимальных условий, построении интерполяционных формул, выборе значимых факторов, оценке и уточнении констант теоретических моделей и др. Методы планирования эксперимента позволяют минимизировать число необходимых испытаний, установить рациональный порядок и условия проведения исследований в зависимости от их вида и требуемой точности результатов. Если же по каким-либо причинам число испытаний уже ограничено, то методы дают оценку точности, с которой в этом случае будут получены результаты. Методы учитывают случайный характер рассеяния свойств испытываемых объектов и характеристик используемого оборудования. Они базируются на методах теории вероятности и математической статистики.

Планирование эксперимента включает ряд этапов.

1. Установление цели эксперимента (определение характеристик, свойств и т. п.) и его вида (определительные, контрольные, сравнительные, исследовательские).

2. Уточнение условий проведения эксперимента (имеющееся или доступное оборудование, сроки работ, финансовые ресурсы, численность и кадровый состав работников и т. п.). Выбор вида испытаний (нормальные, ускоренные, сокращенные в условиях лаборатории, на стенде, полигонные, натурные или эксплуатационные).

3. Выявление и выбор входных и выходных параметров на основе сбора и анализа предварительной (априорной) информации. Входные параметры (факторы) могут быть детерминированными, то есть регистрируемыми и управляемыми (зависимыми от наблюдателя), и случайными, то есть регистрируемыми, но неуправляемыми. Наряду с ними на состояние исследуемого объекта могут оказывать влияние нерегистрируемые и неуправляемые параметры, которые вносят систематическую или случайную погрешность в результаты измерений. Это — ошибки измерительного оборудования, изменение свойств исследуемого объекта в период эксперимента, например, из-за старения материала или его износа, воздействие персонала и т. д.

4. Установление потребной точности результатов измерений (выходных параметров), области возможного изменения входных параметров, уточнение видов воздействий. Выбирается вид образцов или исследуемых объектов, учитывая степень их соответствия реальному изделию по состоянию, устройству, форме, размерам и другим характеристикам.

На назначение степени точности влияют условия изготовления и эксплуатации объекта, при создании которого будут использоваться эти экспериментальные данные. Условия изготовления, то есть возможности производства, ограничивают наивысшую реально достижимую точность. Условия эксплуатации, то есть условия обеспечения нормальной работы объекта, определяют минимальные требования к точности.

Точность экспериментальных данных также существенно зависит от объёма (числа) испытаний — чем испытаний больше, тем (при тех же условиях) выше достоверность результатов.

Для ряда случаев (при небольшом числе факторов и известном законе их распределения) можно заранее рассчитать минимально необходимое число испытаний, проведение которых позволит получить результаты с требуемой точностью.

5. Составление плана и проведение эксперимента — количество и порядок испытаний, способ сбора, хранения и документирования данных.

Порядок проведения испытаний важен, если входные параметры (факторы) при исследовании одного и того же объекта в течение одного опыта принимают разные значения. Например, при испытании на усталость при ступенчатом изменении уровня нагрузки предел выносливости зависит от последовательности нагружения, так как по-разному идет накопление повреждений, и, следовательно, будет разная величина предела выносливости.

В ряде случаев, когда систематически действующие параметры сложно учесть и проконтролировать, их преобразуют в случайные, специально предусматривая случайный порядок проведения испытаний (рандомизация эксперимента). Это позволяет применять к анализу результатов методы математической теории статистики.

Порядок испытаний также важен в процессе поисковых исследований: в зависимости от выбранной последовательности действий при экспериментальном поиске оптимального соотношения параметров объекта или какого-то процесса может потребоваться больше или меньше опытов. Эти экспериментальные задачи подобны математическим задачам численного поиска оптимальных решений. Наиболее хорошо разработаны методы одномерного поиска (однофакторные однокритериальные задачи), такие как метод Фибоначчи, метод золотого сечения.

 

6. Статистическая обработка результатов эксперимента, построение математической модели поведения исследуемых характеристик.

Необходимость обработки вызвана тем, что выборочный анализ отдельных данных, вне связи с остальными результатами, или же некорректная их обработка могут не только снизить ценность практических рекомендаций, но и привести к ошибочным выводам. Обработка результатов включает:

определение доверительного интервала среднего значения и дисперсии (или среднего квадратичного отклонения) величин выходных параметров (экспериментальных данных) для заданной статистической надежности;

проверка на отсутствие ошибочных значений (выбросов), с целью исключения сомнительных результатов из дальнейшего анализа. Проводится на соответствие одному из специальных критериев, выбор которого зависит от закона распределения случайной величины и вида выброса;

проверка соответствия опытных данных ранее априорно введенному закону распределения. В зависимости от этого подтверждаются выбранный план эксперимента и методы обработки результатов, уточняется выбор математической модели.

Построение математической модели выполняется в случаях, когда должны быть получены количественные характеристики взаимосвязанных входных и выходных исследуемых параметров. Это — задачи аппроксимации, то есть выбора математической зависимости, наилучшим образом соответствующей экспериментальным данным. Для этих целей применяют регрессионные модели, которые основаны на разложении искомой функции в ряд с удержанием одного (линейная зависимость, линия регрессии) или нескольких (нелинейные зависимости) членов разложения (ряды Фурье, Тейлора). Одним из методов подбора линии регрессии является широко распространенный метод наименьших квадратов.

Для оценки степени взаимосвязанности факторов или выходных параметров проводят корреляционный анализ результатов испытаний. В качестве меры взаимосвязанности используют коэффициент корреляции: для независимых или нелинейно зависимых случайных величин он равен или близок к нулю, а его близость к единице свидетельствует о полной взаимосвязанности величин и наличии между ними линейной зависимости.

При обработке или использовании экспериментальных данных, представленных в табличном виде, возникает потребность получения промежуточных значений. Для этого применяют методы линейной и нелинейной (полиноминальной) интерполяции (определение промежуточных значений) и экстраполяции (определение значений, лежащих вне интервала изменения данных).

7. Объяснение полученных результатов и формулирование рекомендаций по их использованию, уточнению методики проведения эксперимента.

 

Снижение трудоемкости и сокращение сроков испытаний достигается применением автоматизированных экспериментальных комплексов. Такой комплекс включает испытательные стенды с автоматизированной установкой режимов (позволяет имитировать реальные режимы работы), автоматически обрабатывает результаты, ведет статистический анализ и документирует исследования. Но велика и ответственность инженера в этих исследованиях: четкое поставленные цели испытаний и правильно принятое решение позволяют точно найти слабое место изделия, сократить затраты на доводку и итерационность процесса проектирования.

26 Опишите тип полного факторного эксперимента который используется при построении линейной модели объекта.Работу по планированию эксперимента начинают со сбора априорной информации. Анализ этой информации позволяет получить представление о параметре оптимизации, о факторах, о наилучших условиях ведения исследования, о характере поверхности отклика и т.д. Априорную информацию можно получить из литературных источников, из опроса специалистов, путем выполнения однофакторных экспериментов. Последние, к сожалению, не всегда возможно осуществить, т.к. возможность их осуществления ограничена стоимостью опытов, их длительностью. На основе анализа априорной информации делается выбор экспериментальной области факторного пространства, который заключается в выборе основного (нулевого) уровня и интервалов варьирования факторов. Основной уровень является исходной точкой для построения плана эксперимента, а интервалы варьирования определяют расстояния по осям координат от верхнего и нижнего уровней до основного уровня. Эксперименты при планировании эксперимента нужны для определения численных значений коэффициентов. Чем больше коэффициентов, тем больше нужно опытов. А мы стремимся сократить их число. Следовательно, нужно найти такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявляемым к модели.

Первый этап планирования эксперимента для получения линейной модели основан на варьировании факторов на двух уровнях. В этом случае, если число факторов известно, можно сразу найти число опытов, необходимое для реализации всех возможных со­четаний уровней факторов. Простая формула, которая для этого используется, уже приводилась: , где N – число опытов, k – число факторов, 2 – число уровней. В общем случае эксперимент, в котором реализуются все­возможные сочетания уровней факторов, называется полным факторным экспериментом.

27 Перечислите этапы обработки результатов эксперимента. Наблюдая и измеряя характеристики объекта, экспериментатор собирает первичный статистический материал. Дальнейшая задача состоит в такой обработке и представлении первичных данных, которые позволили бы оценить и сопоставить результаты для проверки гипотез, для выявления существенных свойств и закономерностей педагогического процесса. В основе методов обработки лежит предварительное упорядочение, cиcтeмaтиaция первичных данных и вычисление их статистических характеристик.

Обобщенный алгоритм подготовки данных может быть представлен следующим операциями:
а) все данные формулируются и записываются в необходимой краткой форме;
б) проводится группировка данных, то есть распределение их на однородные группы в соответствии с интересующими экспериментатора признаками. Данные в каждой группе упорядочиваются - классифицируются, сортируются, структурируются в соответствии с той моделью, которая разрабатывалась при составлении плана-программы (линейный, параллельный или перекрестный эксперимент);
в) устанавливаются характеристики (признаки, параметры каждой группы данных и производится подсчет абсолютного числа факторов, характеризующих группу (число учащихся, уроков, отметок, ответов и т.д.);
г) данные внутри каждой сформированной группы располагаются в ряд (вариационный ряд) по убыванию или возрастанию признака. Определяется наибольшее и наименьшее значенияпризнака;
д) вариационные ряды данных, полученных в номинальной или порядковой шкале, ранжируются. Интервалы группировки по рангам выбираются оптимальными (слишком крупные интервалы скрывают нюансы явлений, слишком дробные - затрудняют o6pаботку). В результате этой операции появляются новые количественные данные;
е) проводится статистическая обработка полученных количественных данных, заключающаяся в вычислении некоторых статистических характероистик и оценок, позволяющих глубже понятьособенности экспериментальных явлений;
ж) составляются наглядные материалы, отображающие полученную информацию: таблицы, графики, диаграммы, схемы и др., по которым в дальнейшем устанавливаются и анализируются связи между параметрами экспериментальных объектов.

Полученные первичные результаты в виде таблиц и графиков ис- пользуются для расчёта конечных значений величин и их погрешностей либо для нахождения зависимости измеряемых величин между собой. Все расчёты удобно проводить в той же рабочей тетради, где записаны первичные результаты измерений, и заносить в соответствующие свободные колонки таблиц с экспериментальными данными. Это поможет проводить проверку, анализ и сопоставление получаемого результата с исходными данными. Для измеряемых величин окончательные результаты должны быть представлены в виде среднего значения, погрешности и количества про- ведённых измерений. В случае косвенных измерений для получения окончательного результата используются их зависимости от измеряемых величин, по которым вычисляют и средние значения и погрешности. Для окончательной оценки качества полученных результатов измерений надо сравнить их с данными, приводимыми в справочниках.

28 Опишите процесс обработки при интерпретации модели

Задача выполняется в MS Excel. На балансе организации имеется медицинское оборудование стоимостью 2000 евро. Расчетный срок эксплуатации оборудования –6 лет. Остаточная стоимость – 100 евро. Рассчитать годовые амортизационные отчисления, учитывая линейный характер износа оборудования.

Задача Решается с формулой Апл Нач стоимость;Остаточная стоимость;время эксплуатации. Итог 316,66

30 Задача выполняется в MS Excel. Банком выдан кредит в 500 тысяч тенге сроком на 3 года по ставке 10% годовых. Кредит должен быть погашен равными долями,

Выплачиваемыми в конце каждого квартала. Разработать план погашения кредита,


Дата добавления: 2018-02-28; просмотров: 409; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!