Лабораторная работа 9. Средние величины. Показатели вариации
Цель работы. Изучить основные принципы расчета средних величин и показателей вариации по несгруппированным и сгруппированным данным, а также с использованием стандартных функций Microsoft Excel.
Порядок выполнения работы
1. Познакомиться с теоретическими сведениями по теме работы.
2. Скопировать из данного документа данные в соответствии с номером варианта на рабочий лист Microsoft Excel.
3. Определить средние величины и показатели вариации по не сгруппированным данным, используя расчетные формулы для этих величин.
4. Определить средние величины и показатели вариации по сгруппированным данным (дискретный вариационный ряд), используя расчетные формулы для этих величин.
5. Определить средние величины и показатели вариации по сгруппированным данным (интервальный вариационный ряд), используя расчетные формулы для этих величин.
6. Выполнить расчеты показателей по не сгруппированным данным, используя стандартные функции Microsoft Excel.
7. Сравнить значения вычисленных показателей для разных случаев.
8. На основе анализа значения коэффициента вариации сформулировать вывод об однородности или неоднородности исследуемой совокупности значений изучаемого признака.
9. Оформить отчет по работе.
Краткие теоретические сведения
Средняя арифметическая простая используется в тех случаях, когда расчет осуществляется по несгруппированным данным, и имеет вид:
(1)
При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться в совокупности несколько раз. В подобных случаях расчет средней производится по сгруппированным данным, то есть данным представленным в виде дискретных или интервальных вариационных рядов распределения.
Средняя арифметическая взвешенная определяется по формуле:
(2)
Мода – значение признака, наиболее часто встречающееся в совокупности.
Расчет моды для несгруппированных данных состоит в определении наиболее часто встречающегося значения. Если два и более варианта признака встречаются чаще остальных, то будет соответственно несколько модальных значений.
Расчет моды для дискретного ряда распределения состоит в определении признака имеющего наибольшую частоту.
Моду для интервального ряда распределения определяют по формуле:
, (3)
где
– нижняя граница модального интервала;
i – величина модального интервала;
– частота модального интервала;
– частота интервала, предшествующего модальному;
– частота интервала, следующего за модальным.
Модальным называется интервал с наибольшей частотой рассматриваемого признака.
Медиана – это значение признака, находящееся в середине ранжированной (упорядоченной по возрастанию или убыванию) совокупности. Медиана делит изучаемую совокупность на две равные части – у половины единиц совокупности значение признака меньше медианы, а у другой половины единиц совокупности значение признака больше медианы.
Порядок расчета медианы:
1. расположить данные в порядке возрастания (или убывания) значений признака;
2. определить номер медианной единицы
, (4)
где
– номер медианной единицы,
n – число единиц совокупности;
3. определить медиану, т. е. значение признака соответствующее номеру медианной единицы.
В дискретном ряду распределения медиана находится непосредственно по накопленной частоте, соответствующей номеру медианы.
Медиана количественного признака для интервального ряда распределения определяется по формуле:
, (5)
где
– нижняя граница медианного интервала;
i – величина интервала;
– накопленная частота интервала, предшествующего медианному;
– частота медианного интервала;
– число единиц совокупности.
Медианный интервал – это первый интервал, в котором накопленная частота составляет половину или больше половины общей суммы частот.
Колеблемость отдельных значений характеризуют показатели вариации. Статистические показатели, определяющие вариацию, делятся на две группы: абсолютные и относительные. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Вторая группа показателей вычисляется как отношение абсолютных показателей вариации к средней арифметической. Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение.
Самым простым абсолютным показателем является размах вариации. Размах вариации показывает, насколько велико различие между единицами совокупности, имеющими наименьшее и наибольшее значение признака:
R=xmax-xmin, (6)
где хmах и хmin - соответственно, наибольшее и наименьшее значения признака в совокупности.
Среднее линейное отклонение вычисляется как средняя арифметическая (простая или взвешенная в зависимости от исходных данных) из абсолютных значений отклонений вариант от среднего значения признака по следующим формулам:
- простая форма; (7)
- взвешенная форма, (8)
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой и взвешенной дисперсии:
- простая форма; (9)
- взвешенная форма, (10)
Среднее квадратическое отклонение равно корню квадратному из дисперсии:
(11)
Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Оно выражается в тех же единица измерения, что и признак (в метрах, тоннах, рублях, процентах и т. д.)
Относительные показатели вариации выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.
Коэффициент осцилляции – процентное отношение размаха вариации к средней:
(12)
Линейный коэффициент вариации измеряют через соотношение среднего линейного отклонения и средней:
(13)
Коэффициент вариации измеряют через соотношение среднего квадратического отклонения и средней:
(14)
Наиболее часто в практических расчетах применяется показатель относительной вариации – коэффициент вариации.
Для распределений, близких к нормальному, совокупность считается однородной, если коэффициент вариации не превышает 33 %.
При расчете средних величин и показателей вариации по не сгруппированным данным используются стандартные функции Microsoft Excel (табл. 1).
Таблица 1
Стандартные функции Microsoft Excel используемые при расчете показателей по не сгруппированным данным
Показатель | Используемая функция |
Средняя арифметическая простая Мода дискретного ряда Медиана дискретного ряда Минимальное значение Максимальное значение Среднее линейное отклонение Дисперсия Среднее квадратическое отклонение | СРЗНАЧ МОДА. ОДН МЕДИАНА МИН МАКС СРОТКЛ ДИСП. Г СТАНДОТКЛОН. Г |
Варианты заданий
Вариант 1
22,5 | 20,2 | 19,3 | 19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 |
21,6 | 19,9 | 18,3 | 16,4 | 17,3 | 18,3 | 15,8 | 21,2 | 19,3 |
17,8 | 20,5 | 20,6 | 19,4 | 18,7 | 16,3 | 18,4 | 19,3 | 18,8 |
Вариант 2
18,8 | 20,2 | 19,3 | 19,9 | 23,2 | 22,5 | 17,4 | 21,8 | 19,2 |
19,4 | 18,7 | 16,3 | 18,4 | 19,3 | 18,8 | 19,4 | 18,7 | 16,3 |
20,5 | 20,6 | 19,4 | 18,7 | 16,3 | 18,4 | 19,3 | 18,8 | 17,8 |
Вариант 3
20,2 | 19,3 | 19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 22,4 |
18,7 | 20,2 | 19,3 | 19,9 | 23,2 | 22,5 | 17,4 | 21,8 | 19,2 |
18,1 | 19,8 | 18,2 | 16,4 | 17,2 | 21,8 | 15,8 | 21,2 | 19,2 |
Вариант 4
19,4 | 18,7 | 16,3 | 18,4 | 19,3 | 18,8 | 19,4 | 18,7 | 16,3 |
18,5 | 20,6 | 19,4 | 20,7 | 16,3 | 18,4 | 19,3 | 18,8 | 17,8 |
20,1 | 19,3 | 19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 22,4 |
Вариант 5
19,7 | 20,2 | 19,3 | 18,9 | 23,2 | 22,5 | 17,4 | 21,8 | 19,2 |
18,3 | 19,8 | 18,2 | 16,4 | 17,2 | 21,8 | 15,8 | 21,2 | 19,2 |
19,7 | 18,7 | 16,3 | 18,4 | 19,3 | 18,8 | 19,4 | 18,7 | 16,3 |
Вариант 6
19,4 | 20,7 | 16,3 | 18,4 | 19,3 | 18,8 | 17,8 | 18,7 | 20,2 |
19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 22,4 | 18,1 | 19,8 |
19,3 | 18,9 | 23,2 | 22,5 | 17,4 | 21,8 | 19,2 | 19,4 | 18,7 |
Вариант 7
18,7 | 16,3 | 18,4 | 19,3 | 18,8 | 19,4 | 18,7 | 18,5 | 20,6 |
20,6 | 19,4 | 20,7 | 16,3 | 18,4 | 19,3 | 18,8 | 18,4 | 19,3 |
19,3 | 19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 18,4 | 19,3 |
Вариант 8
16,3 | 18,4 | 19,3 | 18,8 | 19,4 | 18,7 | 18,5 | 20,6 | 18,7 |
19,4 | 20,7 | 16,3 | 18,4 | 19,3 | 18,8 | 18,4 | 19,3 | 20,6 |
19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 18,4 | 19,3 | 19,3 |
Вариант 9
19,3 | 19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 22,5 | 20,2 |
18,3 | 16,4 | 17,3 | 18,3 | 15,8 | 21,2 | 19,3 | 21,6 | 19,9 |
20,6 | 19,4 | 18,7 | 16,3 | 18,4 | 19,3 | 18,8 | 17,8 | 20,5 |
Вариант 10
19,4 | 20,7 | 16,3 | 18,4 | 19,3 | 18,8 | 17,8 | 18,7 | 20,2 |
19,9 | 23,1 | 18,8 | 17,4 | 21,6 | 19,1 | 22,4 | 18,1 | 19,8 |
19,3 | 18,9 | 23,2 | 22,5 | 17,4 | 21,8 | 19,2 | 19,4 | 18,7 |
Пример выполнения задания
Задание. Рассчитать среднее значение, структурные средние, показатели вариации, используя данные из табл. 1. Определить степень однородности совокупности данных.
Таблица 1
20,2 | 19,3 | 19,9 | 23,1 | 18,8 | 17,4 |
19,9 | 18,3 | 16,4 | 17,3 | 18,3 | 15,8 |
20,5 | 20,6 | 19,4 | 18,7 | 16,3 | 18,4 |
21,6 | 21,2 | 19,3 | 19,1 | 19,3 | 18,8 |
При расчете показателей по не сгруппированным данным необходимо использовать соответствующие формулы.
Ход выполнения задания
Для выполнения расчетов на Лист 1 рабочей книги Microsoft Excel скопируйте таблицу значений в соответствии с номером варианта из данного документа. Расположите данные в один столбец, начиная с ячейки A2. Введите заголовок столбца «xi». Отсортируйте данные в столбце по возрастанию значений признака. Справа добавьте ещё 2 столбца для вычисления абсолютных значений отклонений значений признака от среднего и квадратов отклонений (рис. 1). Вычислите среднее значение как сумму всех значений признака, делённую на объём совокупности значений (n). Заполните второй и третий столбцы таблицы расчётными формулами. Внизу таблицы найдите суммы по каждому столбцу. Значения моды и медианы определите визуально, проанализировав значения в первом столбце. Наибольшая частота признака равна 3 и соответствует значению 19,3. Это значение есть значение моды. Медианное значение равно (24+1)/2=12,5, что соответствует значению признака с номером 13, то есть тоже равно 19,3. Введите в ячейки F6:F12 формулы для расчёта показателей вариации ряда значений признака. В ячейки столбца G введите формулы для расчёта среднего, среднего линейного отклонения, дисперсии и среднего квадратического отклонения с использованием соответствующих стандартных функций Excel. Расчёт остальных значений выполните по тем же формулам, что использовались в столбце F (протянуть формулы вправо на 1 ячейку). Сравните получившиеся результаты в столбцах F и G, Они должны совпасть.
Рис. 1. Вид расчетной таблицы
Сформируйте на Листе 2 дискретный вариационный ряд с указанием частот значений:- скопируйте первый столбец (без суммы значений) на Лист 2; в столбце B укажите частоты значений, оставляя ячейки повторяющихся значений пустыми (рис. 2);

Рис. 2
- удалите с листа строки, соответствующие пустым ячейкам в столбце B.

Рис. 3
Скопируйте столбец А с Листа 1 на Лист 3. Постройте интервальный ряд, выполнив группировку данных. Используйте разбиение на 5 интервалов. При выполнении группировки используйте алгоритм, применённый в лаб. работе 8. Постройте вспомогательную таблицу следующего вида:Номер интервала | Левая граница | Правая граница | Середина интервала xi' | Абсолютная частота fi | x'i · fi | |хi'-xср|⋅fi | (х'i - xср)2⋅fi | Накопленные частоты
|
1 | ||||||||
2 | ||||||||
... |


