,

или (А)

имеет распределение с степенями свободы, где число интервалов эмпирического распределения (вариационного ряда); число параметров теоретического распределения, вычисленных по экспериментальным данным.

Числа и - соответственно эмпирические и теоретические частоты. Схема применения критерия для проверки гипотезы сводится к следующему:

1.  Определяется мера расхождения эмпирических и теоретических частот по (А).

2.  Для выбранного уровня значимости по таблице распределения находят критическое значение при числе степеней свободы .

3.  Если фактически наблюдаемое значение больше критического, т. е. то гипотеза отвергается, если гипотеза не противоречит опытным данным.

Замечание. Статистика (А) имеет распределение лишь при поэтому

необходимо, чтобы в каждом интервале было достаточное количество наблюдений, по крайней мере 5 наблюдений. Если в каком-нибудь интервале число наблюдений имеет смысл объединить соседние интервалы, чтобы в объединенных интервалах было не менее 5 (поэтому при вычислении числа степеней свободы в качестве величины берется соответственно уменьшенное число интервалов).

Таблица 13

Выработка в отчетном году в процентах к предыдущему

Частота (количество рабочих)

Частость (доля рабочих)

Накопленная частота

Накопленная частость

или

1

2

3

4

5

6

7

8

94,0 – 100,0

100,0 – 106,0

112,0 – 118,0

118,0 – 124,0

130,0 – 136,0

3

7

11

20

28

19

10

2

0,03

0,07

0,11

0,20

0,28

0,19

0,10

0,02

3

10

21

41

69

88

98

100

0,03

0,10

0,21

0,41

0,69

0,88

0,98

1,00

100

1,0

-

-

Пример. Для эмпирического распределения рабочих цеха по данным двух граф табл. 13 подобрать соответствующее распределение и на уровне значимости проверить гипотезу о согласованности двух распределений с помощью критерия

НЕ нашли? Не то? Что вы ищете?

Рис. 15

Решение. По виду гистограммы распределения рабочих по выборке (рис.15 ) можно предположить нормальный закон распределения признака. Параметры нормального закона и , т. е. математическое ожидание и дисперсия случайной величины , неизвестны. Заменим их соответствующими наилучшими оценками по выборке - и . Так как число наблюдений достаточно велико, то вместо «исправленной» можно взять выборочную дисперсию . Значения и соответственно равны: (%) и (%).

Выдвигаемая гипотеза случайная величина - выработка рабочих цеха – распределена нормально с параметрами т. е.

*~

Для проверки этой гипотезы рассчитаем теоретические вероятности попадания случайной величины в интервал используя функцию Лапласса в соответствии со свойством нормального распределения:

Например,

соответствющая первому интервалу теоретическая частота . Аналогично рассчитываются

Для определения статистики удобно составить таблицу 14:

Таблица 14

Интервал

Эмпирические частоты

Теоретические вероятности

Теоретические частоты

1

2

3

4

5

6

7

8

94 – 100

100 –106

106-112

112-118

118-124

124-130

130-136

136-142

3

7

11

20

28

19

10

2

0,017

0,059

0,141

0,228

0,247

0,182

0,087

0,029

1,7 7,6

5,9

14,1

22,8

24,7

18,2

8,7 11,6

2,9

5,76

9,61

7,84

10,89

0,64

0,16

0,759

0,682

0,344

0,441

0,035

0,014

100

0,990

99,0

-

Учитывая, что в рассматриваемом эмпирическом распределении частоты первого и последнего интервалов ( меньше 5, при использовании критерия Пирсона в соответствии с замечанием на стр. 76 целесообразно объединить указанные интервалы с соседними (см. табл. 14 ).

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28