σ2 (2 случай) =

σ (1 случай) = (шт);

σ (2 случай) = (шт).

Показатели дисперсии говорят о том, что она во втором случае больше, нежели в первом; но она имеет другую размерность, отличную от размерности признака.

Среднее квадратическое отклонение имеет ту же размерность, что и размерность признака:

(раза).

График квадратов отклонений вариант от средней (рис. 6.1) (к примеру 5.13).

Рис. 6.1

♦ Коэффициент вариации.

Пример 6.1 (табл. 6.2):

Таблица 6.2

Цена (ден. ед.)

Товар А

Товар Б

σ = 4

σ = 6

Что варьирует больше?

Средние квадратические отклонения разных явлений сравнивать нельзя. Для сравнения вариаций разных явлений используется коэффициент (процент) вариации ():

. (6.8)

По примеру:

;

 

Варьирует больше цена товара А.

Процентное отношение среднеквадратического отклонения к среднеарифметической называется коэффициентом вариации

Пример 6.2 (табл. 6.3):

Таблица 6.3

Урожайность кукурузы, центнеры

Районы

I

II

σ = 10

σ = 9

То есть явление (урожайность) одно и тоже, но разные исходные данные для среднеквадратических отклонений (уровни ). В этом случае для сравнения вариаций тоже используют коэффициент вариации:

υ1 = 25 %; υ2 = 30 %;

Следующий пример служит переходом ко второму вопросу.

Пример 6.3:

Данные лабораторных исследований урожайности (участки по 1 м2, урожай грамм/см2) (табл. 6.4).

Таблица 6.4

Участки

Количество, шт.

Средний урожай

Дисперсия

Среднеквадратическое отклонение

f

σ2

σ

Все

125

140,20

338,40

18,4

из них:

неудобренные

55

126,64

200,00

14,1

удобренные

70

150,86

190,00

13,8

Рассуждения:

НЕ нашли? Не то? Что вы ищете?

1) общая дисперсия (338,4) больше каждой из дисперсий в группах (200; 190), это значит, что удобренность повлияла на величину общей дисперсии, что естественно, так как урожайность по группам значительно отличается (126, 64; 150, 86); значит, кроме вариации внутри группы присутствует вариация между группами;

2. Внутригрупповая и межгрупповая дисперсии; правило сложения дисперсий

2.1. Внутригрупповая и межгрупповая дисперсии

Продолжение рассуждений по примеру 6.3:

2) если бы все участки остались не удобренными, то дисперсия была бы между 200 и 190, эта дисперсия вызвана всеми прочими факторами, за исключением удобренности;

Общая мера влияния этих других факторов определяется как средняя взвешенная из внутригрупповых дисперсий.

, (6.9)

где i – номера групп.

3) общая дисперсия равна 338,2, значит её «недостающую» часть

(338,4 – 194,4 = 144) обусловил группировочный признак (удобренность).

Эту дисперсию, вызванную группировочным признаком, называют межгрупповой дисперсией (). Её можно рассчитывать и следующим образом:

Продолжение примера 6.3 (табл. 6.5):

Примем за варианты средние по группам и рассчитаем среднюю из этих средних ():

.

Исчислим средний квадрат отклонений (дисперсию) между этими средними ():

Таблица 6.5

f

( - )

( - )2

( - )2 × f

126,64

55

-13,56

183,9

10114,5

150,86

70

10,66

113,6

7952,0

Итого:

125

18066,5

(6.10)

Вывод по примеру 6.3:

● 43 % общей дисперсии вызваны группировочным признаком – удобренностью

● 57 % общей дисперсии обусловлены прочими факторами

Таким образом, дисперсия, вызванная группировочным признаком (признаком-фактором) рассчитывается как средний квадрат отклонений групповых средних из этих средних.

2.2. Правило сложения дисперсий

Выкладки по примеру 6.3 позволяют сформулировать следующее правило: общая дисперсия является суммой внутригрупповой дисперсии и дисперсии групповых средних (рис. 6.2).

Общая дисперсия

Рис. 6.2

. (6.11)

2.3. Коэффициент детерминации и эмпирическое корреляционное отношение

Отношение дисперсии групповых средних (дисперсии, вызванной группировочным признаком) к общей дисперсии называется коэффициентом детерминации ().

Determinantis (лат.) – определяющий.

. (6.12)

В примере 6.3 = 0,43.

Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением (). Эмпирическое корреляционное отношение показывает тесноту связи между признаком-фактором и признаком-результатом.

В привязке к примеру 6.3:

,

при – идеальное корреляционное отношение, т. е. между признаком-фактором и признаком-результатом функциональная зависимость;

при – никакой связи между признаками нет.

Как мы уже отмечали, дисперсия в статистике является одной из основных мер вариации признака, но для исследования вариации следует дать оценку тому, как вариация признака распределяется в изучаемом вариационном ряду с учётом частот.

3. Анализ характера распределения в вариационных рядах

3.1. Нормальное распределение

В учебной дисциплине «Математическая статистика» вы изучили такую категорию, как «кривая нормального распределения».

Главные свойства этой кривой переносятся и на любую идеально-однородную генеральную совокупность. Из этих свойств нам в дальнейшем будут необходимы перечисляемые ниже.

1-ое свойство. Средняя, медиана и мода по величине совпадают рис. 6.3).

2-е свойство. Распределение вариант имеет следующие закономерности:

● в пределах от « + σ» до « – σ» находится 68,3 % вариант совокупности (рис. 6.4);

● в пределах « ± 2σ» – 95,4 % вариант совокупности (рис.6.4);

● в пределах « ± 3σ» – 99,7 % вариант совокупности.

f

х

, Ме, Мо

Рис. 6.3

Это свойство называют «правилом трёх сигм».

f

х

2σ σ σ 2σ

68,3 % хi

95,4 % хi

99,7 % х

Рис. 6.4

Пример 6.4:

Обратимся к примеру Ранжируем представленный в примере ряд, изобразим его графически и рассчитаем медиану (рис. 6.5)

 

хi

х 0 3,0 5,0 6,0 7,0 8,0 9,0 10,………………………………….20

Мегс ; № Мегс = ; егс = .

Рис. 6.5

Таким образом, наша генеральная совокупность не является идеально однородной.

Рассчитаем среднее квадратическое отклонение, для этого используем данные этого же примера по строке «Δхi = …»:

Выделим ранжированную выборочную совокупность по данным этого же примера и необходимые для сравнения её характеристик параметры генеральной совокупности.

При этом обозначим через , а через .

 

х 0 3,0 5,0 6,0 7,0 …………………………..20

= 8,2 = 9,1

 

σгс = 4,9 σгс = 4,9

 

гс гс

гс гс

Рис. 6.6

Выводы по рис. 6.6:

1) находится в области « – σгс»;

2) 3 варианты выборочной совокупности (5, 6, 7), т. е. 60 % находятся в области« – σгс»;

3) 4 варианты (3, 5, 6, 7), т. е. 80 % – в области« – 2σгс»;

4) все варианты не превышают по величине « ± 3σгс».

Все рассуждения и примеры, рассмотренные в этом вопросе, нам будут необходимы при изучении теории ошибок выборочного наблюдения (тема 7).

3.2. Выравнивание фактического распределения по кривой нормального распределения

При углубленных статистических исследованиях необходимо проверять, насколько совокупность, которую приняли за генеральную «подчиняется» законам нормального распределения.

Для этого параметры кривой фактического распределения сравнивают с параметрами кривой теоретического распределения.

Для этого фактические частоты (частотности) пересчитывают по

следующей формуле:

, (6.13)

где f(t) = , называемая нормированным отклонением.

Пример 6.5 (табл. 6.6):

Таблица 6.6

Распределение урожая культуры «К» по участкам и расчётам параметров для выравнивания этого ряда по кривой нормального распределения

Вес урожая, г/м2

1

2

3

4

5

6

7

8

9

10

90 – 100

95

2

45,2

2,47

0,0189

1

2

1

1

100 – 110

105

5

35,2

1,92

0,0632

4

7

5

2

110 – 120

115

13

25,2

1,38

0,1539

11

20

16

4

120 – 130

125

17

15,2

0,83

0,2827

19

37

35

2

130 – 140

135

18

5,2

0,28

0,3836

26

55

61

6

140 – 150

145

31

4,8

0,26

0,857

27

86

88

2

150 – 160

155

22

14,8

0,81

0,2874

20

108

108

0

160 – 170

165

12

24,8

1,35

0,1604

11

120

119

1

170 – 180

175

5

34,8

1,90

0,0656

5

125

124

1

Итого:

125

124

Объяснение к табл. 6.6:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22