Статистические характеристики и формулы для их подсчета



Лабораторная работа № 4

Основные характеристики случайной выборки

(описательная статистика в Excel )

Если набор данных содержит информацию о каждом элементе группы или обо всех возможных измерениях, говорят, что такой набор данных представляет генеральную совокупность. Если измерения проводятся на некотором подмножестве генеральной совокупности или выполняется лишь часть всех возможных измерений, такой набор данных называется выборкой. Метод, когда для описания свойств генеральной совокупности используется выборка, называется методом выборочного обследования. При этом методе используют представительную выборку. Обычно в ее качестве применяется случайная выборка. Для характеристики выборки подсчитывают статистические характеристики

Для выполнения заданий в Excel будем создавать компьютерную модель решения задачи.

Компьютерная модель = ячейки данных + ячейки вычислений + ячейки результатов

Алгоритм создания компьютерной модели решения задачи

1. Выбрать на листе Excel ячейки и ввести в них данные с пояснениями

2. Последовательно решать задачу: выполнять действия, расчеты и вносить комментарии к ячейкам, в которых производились расчеты

3. Выделить ячейки с результатами (цветом, шрифтом и др.) и написать вывод

  

Рис. Способы размещения компьютерной модели на листе Excel

 

Задание № 1

Экспериментально получены измерения некоторой величины

Подсчитать основные статистические характеристики данной выборки с использованием пакета Статистика

Чтобы подключить пакет: Сервис – Надстройки – Analysis ToolPak

Сервис – Data Analysis, появляется диалоговое окно, в котором выбрать Descriptive Statistics.

В появившемся диалоговом окне:

 

· ввести диапазон анализируемых данных

· Columns

· Summary statistics

· ОК

Нажатие ОК возвращает числовые характеристики.

 

Задание № 2

Экспериментально получены измерения некоторой величины

 

Подсчитать основные статистические характеристики данной выборки (для определенности те характеристики, которые были подсчитаны в Задании №1) с использованием формул (программирование формул в Excel) (пример см. ниже).

 

Рассмотрим подсчет средней арифметической ряда

Действия Пояснения и визуализация действий
1. Введем исходные данные в столбец
2. С помощью строки состояния подсчитать количество введенных значений и в две соседние ячейки ввести n и количество значений (число)
3.Выделить столбец исходных данных на одну ячейку больше и нажать клавишу . Получим в пустой ячейке сумму выделенного ряда., т.е.  
4. Это значение надо разделить на n, т.е. на значение 50. Для этого в ячейку под ячейкой с суммой ряда ввести формулу: =ячейка с суммой/ ячейка, где находится 50 (указать адреса соответствующих ячеек) Получим значение средней арифметической
5.Для вычисления по некоторым более сложным формулам требуются построения дополнительных рядов по исходному. Поэтому исходные данные мы ввели в столбец.  

Статистические характеристики и формулы для их подсчета

1. Средняя арифметическая ряда:

                                                    

2. Медиана – значение признака, которое находится в середине ранжированного ряда.

Например: 120 125 130 135 140 Þ Me = 130

              8 10 12 16 20 28 30 40 Þ Me = (16+20)/2

3. Мода – наиболее часто встречающееся в ряду значение признака.

5.Средняя геометрическая ряда – корень n-ой степени из произведения всех значений варьирующего признака x:

, n – число наблюдений.

6. Средняя квадратическая ряда:

 

                                                         

7. Средняя гармоническая ряда:

                                                                   

8. Простейшей мерой рассеяния является вариационный размах – разность между наибольшим и наименьшим значениями варьирующего признака.

                                                 

Эта мера рассеяния является лишь приближенной характеристикой варьирующего признака. В практике статистической обработки материала пользуются обычно средним квадратическим отклонением и дисперсией.

9. Среднее квадратическое отклонение:

                                                         , где

 среднее арифметическое,  число наблюдений..

10. Дисперсия -

Эксцесс

Асимметрия

13. Стандартное отклонение Öd2

14. Среднее абсолютное отклонение:

                                                                  .

15. Коэффициент вариации – отношение среднего квадратического отклонения к средней арифметической, выраженное в процентах:

                                              .

 

Задание № 3

Экспериментально получены измерения некоторой величины

Подсчитать основные статистические характеристики данной выборки с использованием встроенных статистических функций Excel.

Вставка – Функция – Статистические – выбрать функцию и ввести данные в диалоговое окно (срзнач, сргарм, сргеом, медиана, мода, мин, макс, дисп и др.)

 

Действия Пояснения и визуализация действий
1. Введем исходные данные в столбец
2. Внизу ряда выбрать ячейку и ввести в нее формулу =СРЗНАЧ(), в скобки ввести диапазон ряда: первую ячейку столбца исходных данных: последнюю ячейку исходных данных. В выделенной ячейке будет подсчитано средняя арифметическая ряда.

Статистические функции Excel

  • СРОТКЛ() - AVEDEV() - Вычисляет среднее абсолютных значений отклонений точек данных от среднего.
  • СРЗНАЧ() - AVERAGE() - Вычисляет среднее арифметическое аргументов.
  • СРЗНАЧА() - AVERAGEA() - Вычисляет среднее арифметическое аргументов, включая числа, текст и логические значения.
  • БЕТАРАСП() - BETADIST() - Определяет интегральную функцию плотности бета-вероятности.
  • БЕТАОБР() - BETAINV() - Определяет обратную функцию к интегральной функции плотности бета-вероятности.
  • БИНОМРАСП() - BINOMDIST() - Вычисляет отдельное значение биномиального распределения.
  • ХИ2РАСП() - CHIDIST() - Вычисляет одностороннюю вероятность распределения хи-квадрат.
  • ХИ2ОБР() - CHIINV() - Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.
  • ХИ2ТЕСТ() - CHITEST() - Определяет тест на независимость.
  • ДОВЕРИТ() - CONFIDENCE() - Определяет доверительный интервал для среднего значения по генеральной совокупности.
  • КОРРЕЛ() - CORREL() - Находит коэффициент корреляции между двумя множествами данных.
  • СЧЁТ() - COUNT() - Подсчитывает количество чисел в списке аргументов.
  • СЧЁТЗ() - COUNTA() - Подсчитывает количество значений в списке аргументов.
  • СЧИТАТЬПУСТОТЫ() - COUNTBLANK() - Подсчитывает количество пустых ячеек в заданном диапазоне.
  • СЧЁТЕСЛИ() - COUNTIF() - Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.
  • КОВАР() - COVAR() - Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.
  • КРИТБИНОМ() - CRITBINOM() - Находит наименьшее значение, для которого биномиальная функция распределения меньше или равна заданному значению.
  • КВАДРОТКЛ() - DEVSQ() - Вычисляет сумму квадратов отклонений.
  • ЭКСПРАСП() - EXPONDIST() - Находит экспоненциальное распределение.
  • FРАСП() - FDIST() - Находит F-распределение вероятности.
  • FРАСПОБР() - FINV() - Определяет обратное значение для F-распределения вероятности.
  • ФИШЕР() - FISHER() - Находит преобразование Фишера.
  • ФИШЕРОБР() - FISHERINV() - Находит обратное преобразование Фишера.
  • ПРЕДСКАЗ() - FORECAST() - Вычисляет значение линейного тренда.
  • ЧАСТОТА() - FREQUENCY() - Находит распределение частот в виде вертикального массива.
  • ФТЕСТ() - FTEST() - Определяет результат F-теста.
  • ГАММАРАСП() - GAMMADIST() - Находит гамма-распределение.
  • ГАММАОБР() - GAMMAINV() - Находит обратное гамма-распределение.
  • ГАММАНЛОГ() - GAMMALN() - Вычисляет натуральный логарифм гамма функции.
  • СРГЕОМ() - GEOMEAN() - Вычисляет среднее геометрическое.
  • РОСТ() - GROWTH() - Вычисляет значения в соответствии с экспоненциальным трендом.
  • СРГАРМ() - HARMEAN() - Вычисляет среднее гармоническое.
  • ГИПЕРГЕОМЕТ() - HYRGEOMDIST() - Определяет гипергеометрическое распределение.
  • ОТРЕЗОК() - INTERCEPT() - Находит отрезок, отсекаемый на оси линией линейной регрессии.
  • ЭКСЦЕСС() - KURT() - Определяет эксцесс множества данных.
  • НАИБОЛЬШИЙ() - LARGE() - Находит k-ое наибольшее значение из множества данных.
  • ЛИНЕЙН() - LINEST() - Находит параметры линейного тренда.
  • ЛГРФПРИБЛ() - LOGEST() - Находит параметры экспоненциального тренда.
  • ЛОГНОРМОБР() - LOGINV() - Находит обратное логарифмическое нормальное распределение.
  • ЛОГНОРМРАСП() - LOGNORMDIST() - Находит интегральное логарифмическое нормальное распределение.
  • МАКС() - MAX() - Определяет максимальное значение из списка аргументов.
  • МАКСА() - MAXA() - Определяет максимальное значение из списка аргументов, включая числа, текст и логические значения.
  • МЕДИАНА() - MEDIAN() - Находит медиану заданных чисел.
  • МИН() - MIN() - Определяет минимальное значение из списка аргументов.
  • МИНА() - MINA() - Определяет минимальное значение из списка аргументов, включая числа, текст и логические значения.
  • МОДА() - MODE() - Определяет значение моды множества данных.
  • ОТРБИНОМРАСП() - NEGBINOMDIST() - Находит отрицательное биномиальное распределение.
  • НОРМРАСП() - NORMDIST() - Выдает нормальную функцию распределения.
  • НОРМОБР() - NORMINV() - Выдает обратное нормальное распределение.
  • НОРМСТРАСП() - NORMSDIST() - Выдает стандартное нормальное интегральное распределение.
  • НОРМСТОБР() - NORMSINV() - Выдает обратное значение стандартного нормального распределения.
  • ПИРСОН() - PEARSON() - Определяет коэффициент корреляции Пирсона.
  • ПЕРСЕНТИЛЬ() - PERCENTILE() - Определяет k-ую персентиль для значений из интервала.
  • ПРОЦЕНТРАНГ() - PERCENTRANK() - Определяет процентную норму значения в множестве данных.
  • ПЕРЕСТ() - PERMUT() - Находит количество перестановок для заданного числа объектов.
  • ПУАССОН() - POISSON() - Выдает распределение Пуассона.
  • ВЕРОЯТНОСТЬ() - PROB() - Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.
  • КВАРТИЛЬ() - QUARTILE() - Определяет квартиль множества данных.
  • РАНГ() - RANK() - Определяет ранг числа в списке чисел.
  • КВПИРСОН() - RSQ() - Находит квадрат коэффициента корреляции Пирсона.
  • СКОС() - SKEW() - Определяет асимметрию распределения.
  • НАКЛОН() - SLOPE() - Находит наклон линии линейной регрессии.
  • НАИМЕНЬШИЙ() - SMALL() - Находит k-ое наименьшее значение в множестве данных.
  • НОРМАЛИЗАЦИЯ() - STANDARDIZE() - Вычисляет нормализованное значение.
  • СТАНДОТКЛОН() - STDEV() - Оценивает стандартное отклонение по выборке.
  • СТАНДОТКЛОНА() - STDEVA() - Оценивает стандартное отклонение по выборке, включая числа, текст и логические значения.
  • СТАНДОТКЛОНП() - STDEVP() - Определяет стандартное отклонение по генеральной совокупности.
  • СТАНДОТКЛОНПА() - STDEVPA() - Определяет стандартное отклонение по генеральной совокупности, включая числа, текст и логические значения.
  • СТОШYX() - STEYX() - Определяет стандартную ошибку предсказанных значений y для каждого значения x в регрессии.
  • СТЬЮДРАСП() - TDIST() - Выдает t-распределение Стьюдента.
  • СТЬЮДРАСПОБР() - TINV() - Выдает обратное t-распределение Стьюдента.
  • ТЕНДЕНЦИЯ() - TREND() - Находит значения в соответствии с линейным трендом.
  • УРЕЗСРЕДНЕЕ() - TRIMMEAN() - Находит среднее внутренности множества данных.
  • ТТЕСТ() - TTEST() - Находит вероятность, соответствующую критерию Стьюдента.
  • ДИСП() - VAR() - Оценивает дисперсию по выборке.
  • ДИСПА() - VARA() - Оценивает дисперсию по выборке, включая числа, текст и логические значения.
  • ДИСПР() - VARP() - Вычисляет дисперсию для генеральной совокупности.
  • ДИСПРА() - VARPA() - Вычисляет дисперсию для генеральной совокупности, включая числа, текст и логические значения.
  • ВЕЙБУЛЛ() - WEIBULL() - Выдает распределение Вейбулла.
  • ZТЕСТ() - ZTEST() - Выдает двустороннее P-значение z-теста.

Задание № 4

Провести сравнение статистических характеристик, полученных тремя разными способами в Excel (по арифметическим формулам, по формулам, встроенным в Excel, с помощью пакета). Вывод сформулировать письменно.


Дата добавления: 2021-06-02; просмотров: 59; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!