Лабораторная работа 9. Средние величины. Показатели вариации

Цель работы. Изучить основные принципы расчета средних величин и показателей вариации по несгруппированным и сгруппиро­ванным данным, а также с использовани­ем стандартных функций Microsoft Excel.

Порядок выполнения работы

1. Познакомиться с теоретическими сведениями по теме работы.

2. Скопировать из данного документа данные в соответствии с номером варианта на рабочий лист Microsoft Excel.

3. Определить средние величины и показатели вариации по не сгруппированным данным, используя расчетные формулы для этих величин.

4. Определить средние величины и показатели вариации по сгруппированным данным (дискретный вариационный ряд), используя расчетные формулы для этих величин.

5. Определить средние величины и показатели вариации по сгруппированным данным (интервальный вариационный ряд), используя расчетные формулы для этих величин.

6. Выполнить расчеты показателей по не сгруппированным данным, используя стандартные функции Microsoft Excel.

7. Сравнить значения вычисленных показателей для разных случаев.

8. На основе анализа значения коэффициента вариации сформулировать вывод об однородности или неоднородности исследуемой совокуп­ности значений изучаемого признака.

9. Оформить отчет по работе.

Краткие теоретические сведения

Средняя арифметическая простая используется в тех случаях, когда расчет осуществляется по несгруппированным данным, и имеет вид:

                       (1)

НЕ нашли? Не то? Что вы ищете?

       При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться в совокупности несколько раз. В подобных случаях расчет средней производится по сгруппированным данным, то есть данным представленным в виде дискретных или интервальных вариационных рядов распределения.

       Средняя арифметическая взвешенная определяется по формуле:

                                       (2)

Мода – значение признака, наиболее часто встречающееся в совокупности.

Расчет моды для несгруппированных данных состоит в определении наиболее часто встречающегося значения. Если два и более варианта признака встречаются чаще остальных, то будет соответственно несколько модальных значений.

Расчет моды для дискретного ряда распределения состоит в определении признака имеющего наибольшую частоту.

Моду для интервального ряда распределения определяют по формуле:

,  (3)

где –  нижняя граница модального интервала;

  i – величина модального интервала;

    – частота модального интервала;

  – частота интервала, предшествующего модальному;

  – частота интервала, следующего за модальным.

Модальным называется интервал с наибольшей частотой рассматриваемого признака.

Медиана – это значение признака, находящееся в середине ранжированной (упорядоченной по возрастанию или убыванию) совокупности. Медиана делит изучаемую совокупность на две равные части – у половины единиц совокупности значение признака меньше медианы, а у другой половины единиц совокупности значение признака больше медианы.

Порядок расчета медианы:

1. расположить данные в порядке возрастания (или убывания) значений признака;

2. определить номер медианной единицы

,  (4)

где – номер медианной единицы,

  n – число единиц совокупности;

3. определить медиану, т. е. значение признака соответствующее номеру медианной единицы.

В дискретном ряду распределения медиана находится непо­средственно по накопленной частоте, соответствующей номеру медианы.

Медиана количественного признака для интервального ряда распределения определяется по формуле:

,  (5)

где – нижняя граница медианного интервала;

  i – величина интервала;

  – накопленная частота интервала, предшествующего медианному;

  –  частота медианного интервала;

  –  число единиц совокупности.

Медианный интервал – это первый интервал, в котором накоп­ленная частота составляет половину или больше половины общей суммы частот.

Колеблемость отдельных значений характеризуют показатели ва­риации. Статистические показатели, определяющие вариацию, делятся на две группы: абсолютные и относительные. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Вторая группа показателей вычисляется как отношение абсолютных показателей вариации к средней арифметиче­ской. Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение.

Самым простым абсолютным показателем является размах вариа­ции. Размах вариации показывает, насколько велико различие между единицами совокупности, имеющими наименьшее и наибольшее значе­ние признака:

R=xmax-xmin,  (6)

где хmах и хmin - соответственно, наибольшее и наименьшее значения признака в совокупности.

Среднее линейное отклонение вычисляется как средняя арифметическая (простая или взвешенная в зависимости от исходных данных) из абсолютных значений отклонений вариант от среднего значения признака по следующим формулам:

  - простая форма;  (7)

  - взвешенная форма,  (8)

Дисперсия представляет собой средний квадрат отклонений инди­видуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой и взвешенной дисперсии:

  - простая форма;  (9)

  - взвешенная форма,  (10)

Среднее квадратическое отклонение равно корню квадратному из дисперсии:

  (11)

Среднее квадратическое отклонение - это обобщающая характе­ристика размеров вариации признака в совокупности. Оно выражается в тех же единица измерения, что и признак (в метрах, тоннах, рублях, про­центах и т. д.)

Относи­тельные показатели вариации выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику од­нородности совокупности.

       Коэффициент осцилляции – процентное отношение размаха вариации к средней:

                                               (12)

Линейный коэффициент вариации измеряют через соотношение среднего линейного отклонения и средней:

  (13)

       Коэффициент вариации измеряют через соотношение среднего квадратического отклонения и средней:

  (14)

Наиболее часто в практических расчетах применяется показатель относительной вариации – коэффициент вариации.

Для распределений, близких к нормальному, совокупность счита­ется  однородной, если коэффициент вариации не превышает 33 %.

При расчете средних величин и показателей вариации по не сгруппированным данным используются стандартные функции Microsoft Excel (табл. 1).

Таблица 1

Стандартные функции Microsoft Excel используемые при расчете показателей по не сгруппированным данным

Показатель

Используемая функция

Средняя арифметическая простая

Мода дискретного ряда

Медиана дискретного ряда

Минимальное значение

Максимальное значение

Среднее линейное отклонение

Дисперсия 

Среднее квадратическое отклонение

СРЗНАЧ

МОДА. ОДН

МЕДИАНА

МИН

МАКС

СРОТКЛ

ДИСП. Г

СТАНДОТКЛОН. Г



Варианты заданий

Вариант 1

22,5

20,2

19,3

19,9

23,1

18,8

17,4

21,6

19,1

21,6

19,9

18,3

16,4

17,3

18,3

15,8

21,2

19,3

17,8

20,5

20,6

19,4

18,7

16,3

18,4

19,3

18,8


Вариант 2

18,8

20,2

19,3

19,9

23,2

22,5

17,4

21,8

19,2

19,4

18,7

16,3

18,4

19,3

18,8

19,4

18,7

16,3

20,5

20,6

19,4

18,7

16,3

18,4

19,3

18,8

17,8


Вариант 3

20,2

19,3

19,9

23,1

18,8

17,4

21,6

19,1

22,4

18,7

20,2

19,3

19,9

23,2

22,5

17,4

21,8

19,2

18,1

19,8

18,2

16,4

17,2

21,8

15,8

21,2

19,2


Вариант 4

19,4

18,7

16,3

18,4

19,3

18,8

19,4

18,7

16,3

18,5

20,6

19,4

20,7

16,3

18,4

19,3

18,8

17,8

20,1

19,3

19,9

23,1

18,8

17,4

21,6

19,1

22,4


Вариант 5

19,7

20,2

19,3

18,9

23,2

22,5

17,4

21,8

19,2

18,3

19,8

18,2

16,4

17,2

21,8

15,8

21,2

19,2

19,7

18,7

16,3

18,4

19,3

18,8

19,4

18,7

16,3


Вариант 6

19,4

20,7

16,3

18,4

19,3

18,8

17,8

18,7

20,2

19,9

23,1

18,8

17,4

21,6

19,1

22,4

18,1

19,8

19,3

18,9

23,2

22,5

17,4

21,8

19,2

19,4

18,7


Вариант 7

18,7

16,3

18,4

19,3

18,8

19,4

18,7

18,5

20,6

20,6

19,4

20,7

16,3

18,4

19,3

18,8

18,4

19,3

19,3

19,9

23,1

18,8

17,4

21,6

19,1

18,4

19,3


Вариант 8

16,3

18,4

19,3

18,8

19,4

18,7

18,5

20,6

18,7

19,4

20,7

16,3

18,4

19,3

18,8

18,4

19,3

20,6

19,9

23,1

18,8

17,4

21,6

19,1

18,4

19,3

19,3


Вариант 9

19,3

19,9

23,1

18,8

17,4

21,6

19,1

22,5

20,2

18,3

16,4

17,3

18,3

15,8

21,2

19,3

21,6

19,9

20,6

19,4

18,7

16,3

18,4

19,3

18,8

17,8

20,5


Вариант 10

19,4

20,7

16,3

18,4

19,3

18,8

17,8

18,7

20,2

19,9

23,1

18,8

17,4

21,6

19,1

22,4

18,1

19,8

19,3

18,9

23,2

22,5

17,4

21,8

19,2

19,4

18,7



Пример выполнения задания

Задание. Рассчитать среднее значение, структурные средние, пока­затели вариации, используя данные из табл. 1. Определить степень одно­родности совокупности данных.

Таблица 1

20,2

19,3

19,9

23,1

18,8

17,4

19,9

18,3

16,4

17,3

18,3

15,8

20,5

20,6

19,4

18,7

16,3

18,4

21,6

21,2

19,3

19,1

19,3

18,8

При расчете показателей по не сгруппированным данным необходи­мо использовать соответствующие формулы.

Ход выполнения задания

Для выполнения расчетов на Лист 1 рабочей книги Microsoft Excel скопируйте таблицу значений в соответствии с номером варианта из данного документа. Расположите данные в один столбец, начиная с ячейки A2. Введите заголовок столбца «xi». Отсортируйте данные в столбце по возрастанию значений признака. Справа добавьте ещё 2 столбца для вычисления абсолютных значений отклонений значений признака от среднего и квадратов отклонений (рис. 1). Вычислите среднее значение как сумму всех значений признака, делённую на объём совокупности значений (n). Заполните второй и третий столбцы таблицы расчётными формулами. Внизу таблицы найдите суммы по каждому столбцу. Значения моды и медианы определите визуально, проанализировав значения в первом столбце. Наибольшая частота признака равна 3 и соответствует значению 19,3. Это значение есть значение моды. Медианное значение равно (24+1)/2=12,5, что соответствует значению признака с номером 13, то есть тоже равно 19,3. Введите в ячейки F6:F12 формулы для расчёта показателей вариации ряда значений признака. В ячейки столбца G введите формулы для расчёта среднего, среднего линейного отклонения, дисперсии и среднего квадратического отклонения с использованием соответствующих стандартных функций Excel. Расчёт остальных значений выполните по тем же формулам, что использовались в столбце F (протянуть формулы вправо на 1 ячейку). Сравните получившиеся результаты в столбцах F и G, Они должны совпасть.

Рис. 1. Вид расчетной таблицы

Сформируйте на Листе 2 дискретный вариационный ряд с указанием частот значений:
    скопируйте первый столбец (без суммы значений) на Лист 2; в столбце B укажите частоты значений, оставляя ячейки повторяющихся значений пустыми (рис. 2);

Рис. 2

    удалите с листа строки, соответствующие пустым ячейкам в столбце B.
Вычислите сумму частот внизу столбца B. Она должна совпасть со значением n на Листе 1. Дополните таблицу справа 4 столбцами, как показано на рис. 3. В столбце С вычислите произведения значений признака на частоты и найдите сумму произведений (внизу столбца). В столбце F определите накопленные частоты. Скопируйте на Лист 2 таблицу с показателями. Удалите данные из столбца «Стандартные функции». Выполните расчет среднего значения по формуле средней взвешенной. Заполните столбцы  D и E таблицы и найдите сумму значений в каждом столбце (внизу столбца). Значения моды и медианы совпадают с вычисленным ранее значением 19,3. Вычислите значения других показателей по формулам для определения взвешенных значений. Проанализируйте полученные результаты, сравнив их с результатами расчётов для не сгруппированного ряда.

Рис. 3

Скопируйте столбец А с Листа 1 на Лист 3. Постройте интервальный ряд, выполнив группировку данных. Используйте разбиение на 5 интервалов. При выполнении группировки используйте алгоритм, применённый в лаб. работе 8. Постройте вспомогательную таблицу следующего вида:



Номер интервала

Левая граница

Правая граница

Середина интервала

xi'


Абсолютная частота

fi

x'i · fi

|хi'-xср|⋅fi

(х'i - xср)2⋅fi

Накопленные частоты

1

2

...

Рассчитайте показатели средних и показатели вариации. Для расчёта моды и медианы используйте формулы 3 и 4 соответственно. Сравните с полученными ранее результатами. Объясните причину появления разницы в значений некоторых величин по сравнению с ранее вычисленными. Сделайте вывод об однородности или неоднородности рассматриваемой совокупности данных.