6.3.3. Структурные характеристики распределения: квантили распределения и мода

К структурным характеристикам ряда распределения кроме медианы и моды относят и другие квантили распределения (квартили, децили и др.).

Квантиль распределения – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности.

Виды квантилей:

1)  медиана (Ме) – значение признака, приходящееся на середину упорядоченной совокупности,

2)  квартили (Q1/4, Q2/4 = Ме, Q3/4) – значения признака, делящие упорядоченную совокупность на 4 равные (по числу единиц) части,

3)  децили (Q0,1, Q0,2,…, Q0,9) – значения признака, делящие упорядоченную совокупность на 10 равных частей,

4)  процентили (Q0,01, Q0,02,…, Q0,99) – значения признака, делящие упорядоченную совокупность на 100 равных частей.

Если данные сгруппированы, то значение квантиля определяется по накопленным частотам. При этом определяется номер группы, которая содержит i-ый квантиль, как номер первой группы от начала ряда, в которой сумма накопленных частот равна или превышает Ni, где i – индекс квантиля.

Если ряд интервальный, то значение квантиля уточняется по формуле:

,

где XQi – нижняя граница интервала, в котором находится i-й квантиль;

F(–1) – сумма накопленных частот интервалов, предшествующих интервалу, в котором находится i-й квантиль;

NQi – частота интервала, в котором находится i-й квантиль.

Квантили распределения представляют собой обобщающие показатели, характеризующие структуру распределения признака в совокупности.

НЕ нашли? Не то? Что вы ищете?

Наиболее распространенным видом квантилей является медиана. Медиана не требует знания всех индивидуальных значений признака. Она не чувствительна к крайним значениям признака, которые могут резко отличаться от основной массы его значений. Поэтому медиану используют как наиболее надежный показатель типичного значения признака в неоднородной совокупности.

Глава 7. Показатели вариации

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два распределения, имеющие одинаковую среднюю арифметическую, могут значительно отличаться друг от друга по степени вариации признака.

Рассмотрим данные о распределении стажа работы сотрудников в двух филиалах фирмы (табл. 7.1).

Таблица 7.1

Стаж работы сотрудников в фирме

Номер работника

Стаж работы, лет

Филиал 1

Филиал 2

1

1

6

2

2

6

3

3

7

4

3

7

5

4

7

6

9

7

7

10

8

8

12

8

9

13

8

10

15

8

Итого

72

72

Средний стаж работы, лет

Средний стаж работы в первом и втором филиалах фирмы составляет 7,2 года. Однако, если во втором филиале стаж работников близок к средней величине, то в первом филиале фирмы нет даже работников, имеющих стаж от 5 до 8 лет.

Таким образом, значение средней величины не типично для первого филиала, а во втором филиале вариация стажа значительно меньше. Следовательно, чтобы сделать вывод о типичности средней величины для совокупности, необходим показатель, характеризующий вариацию признака. В этих филиалах одинаковый средний стаж работы сотрудников, но существует различие этих показателей по степени рассеяния вариантов стажа в совокупности. Изучение вариации имеет большое значение в статистике и социально-экономических исследованиях. Поэтому важным становится вопрос вариации представленного ряда распределения и отклонений от среднего значения.

Вариация – изменения значения признака в пределах совокупности. Можно выделить абсолютные и относительные показатели вариации. Показатели вариации позволяют, например, оценить степень однородности совокупности, типичности и устойчивости средней, определить величину возможной погрешности выборочного наблюдения.

Наиболее часто используемыми показателями вариации являются:

Абсолютные показатели вариации:

1)  размах вариации;

2)  среднее линейное отклонение;

3)  средний квадрат отклонений (дисперсия);

4)  среднее квадратическое отклонение;

Относительные показатели вариации:

5)  коэффициент осцилляции;

6)  относительное линейное отклонение;

7)  коэффициенты вариации.

7.1. Абсолютные показатели вариации

Рассмотрим эти показатели.

Размах вариации показывает, на какую максимальную величину изменяется значение количественно варьирующего признака. Размах вариации дает лишь самое общее представление о размерах вариации, так как показывает, насколько отличаются крайние варианты признака. Для определения этого показателя требуется найти разность между максимальным (xmax) и минимальным (xmin) значениями признака в совокупности (в ряду распределения).

Размах вариации обозначают обычно R.

.

Пример (см. табл. 7.1.)

Размах вариации для первого филиала

R1 = 15 – 1 = 14.

Размах вариации для второго филиала

R2 = 8 – 6 = 2.

Недостатком данного показателя является то, что он не указывает, насколько велики отклонения всех вариантов друг от друга.

Гораздо более точной являются характеристики вариации, когда учитывается отклонения каждого из вариантов, например, от средней величины.

Среднее линейное отклонение

Среднее линейное отклонение обозначают`L. Среднее линейное отклонение вычисляется по формуле средней арифметической (взвешенной или простой):

,

,

где – частота или частость.

Пример. Рассчитаем среднее линейное отклонение для двух филиалов (табл. 7.1 и 7.2)

Таблица 7.2

Таблица расчетов среднего линейного отклонения

Номер работника

Стаж работы, лет

Филиал 1

Филиал 2

Филиал 1

Филиал 2

1

1

6

6,2

1,2

2

2

6

5,2

1,2

3

3

7

4,2

0,2

4

3

7

4,2

0,2

5

4

7

3,2

0,2

6

9

7

1,8

0,2

7

10

8

2,8

0,8

8

12

8

4,8

0,8

9

13

8

5,8

0,8

10

15

8

7,8

0,8

Итого

72

72

46

6,4

Для первого филиала:

Для второго филиала:

Однако среднее линейное отклонение сравнительно редко применяется для оценки вариации признака. Обычно вычисляется дисперсия s2 и среднее квадратическое отклонение s. Эти показатели применяются не только для оценки вариации признака как таковой, но и для измерения связи между явлениями, для оценки точности (величины ошибки) выборочного наблюдения и других целей.

Дисперсия

Дисперсия представляет собой средний квадрат отклонений вариантов признака от средней величины. Применяется несколько методов и соответствующих им формул вычисления дисперсии.

Для несгруппированного ряда:

для сгруппированного ряда:

Дисперсия может быть также вычислена, как разность среднего квадрата значения признака и квадрата среднего арифметического значения признака:

где .

Таблица 7.3

Таблица расчетов дисперсии

Номер работника

Стаж работы, лет

Филиал 1

Филиал 2

Филиал 1

Филиал 2

1

1

6

38,44

1,44

2

2

6

27,04

1,44

3

3

7

17,64

0,04

4

3

7

17,64

0,04

5

4

7

10,24

0,04

1

9

7

3,24

0,04

7

10

8

7,84

0,64

8

12

8

23,04

0,64

9

13

8

33,64

0,64

10

15

8

60,84

0,64

Итого

72

72

239,6

5,6

Для первого филиала:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14