Пример. Для эмпирического распределения рабочих цеха по выработке по данным первых двух граф табл. 8.1 подобрать соответствующее теоретическое распределение и на уровне значимости б = 0,05 проверить гипотезу о согласованности двух распределений с помощью критерия Х2

Р е ш е н и е.

По виду гистограммы распределения рабочих по выработке (рис. 10.7)можно предположить нормальный закон распределения признака. Параметры нормального закона б и у2  являющиеся соответственно математическим

ожиданием и дисперсией случайной величины Х, неизвестны, поэтому заменяем их «наилучшими» оценками по выборке — несмещенными и состоятельными оценками соответственно выборочной средней  «исправленной» выборочной дисперсией Так как число наблюдений n= 100 достаточно велико, то вместо «исправленной» можно взять «обычную» выборочную дисперсию В примере 8.8 вычислены =119,2(%),=87,48, S= 9,35(%).

Итак, выдвигаемая гипотеза Нo: случайная величина Х — выработка рабочих цеха — распределена нормально с параметрами б= 119,2;  у2= 87,48, т. е. Х~ N(1 19,2; 87,48).

Для расчета вероятностей рi попадания случайной величины Х в интервал [хi, xi+1] используем функцию Лапласа в соответствии со свойством нормального распределения:

Например 

и соответствующая первому интервалу теоретическая частота nрi=100*0.0166 ≈ 1,7 и т. д.

Для определения статистики  Х2 удобно составить таблицу (табл. 10.3).

Учитывая, что в рассматриваемом эмпирическом распределении частоты первого и последнего интервалов (n1 =3 , n8 = 2) меньше 5, при использовании критерия Х2Пирсона в соответствии с замечанием на с. 359 целесообразно объединить указанные интервалы с соседними (см. табл. 10.3).

НЕ нашли? Не то? Что вы ищете?

Итак, фактически наблюдаемое значение статистики Х2= 2,27.

Так как новое число интервалов (с учетом объединения крайних) m = 6, а нормальный закон распределения определяется r = 2параметрами, то число степеней свободы k = m — г — 1 == 6—2—1 =3. Cоответствующее критическое значение статистики Х2 по табл.

V приложений Х20.05;3= 7,82. Так как  Х2< Х20,05;3, то гипотеза о выбранном теоретическом нормальном законе N( 119,2; 87,48) согласуется с опытными данными.

З а м е ч а н и е. Для графического изображения эмпирического и выравнивающего его теоретического нормального распределений необходимо использовать одинаковый для двух распределений масштаб по оси ординат.

Так, если при построении гистограммы эмпирического распределения по оси ординат откладывать плотность частости (где ni — частота i-го интервала (i = 1, 2, ..., m), ∆x — величина интервала, m — число интервалов, n — число наблюдений, объем выборки), то выравнивать такую гистограмму будет теоретическая нормальная кривая с плотностью  , где в качестве параметров б и у2 используются их состоятельные и несмещенные выборочные оценки: соответственно средняя дисперсия  (либо  = при больших n).

Для построения кривой (х) можно использовать таблицу плотности вероятности стандартного нормального распределения (табл. 1 приложений) в соответствии с формулой

При равенстве величин всех интервалов (как в примере 10.12) часто бывает удобнее при построения гистограммы эмпирического распределения по оси ординат откладывать частости (см. рис. 10.7)или частоты ni,. В этом случае выравнивающей гистограмму кривой будет растянутая (сжатая) вдоль оси ординат в ∆х раз нормальная кривая, т. е. кривая ц1(х) = цN(х)∆х (или кривая ц2(х) = цN(х)n∆х).

Точное построение выравнивающей кривой ц1 (х) (или ц2(x)) связано с проведением дополнительных расчетов. Их можно избежать используя п р и б л и ж е н н ы й способ построения (см. рис. 10.7) В процессе применения Х2-критерия Пирсона были вычислены вероятности рi, и теоретические частоты nрi, интервалов распределения. Учитывая, что в соответствии со свойствами плотности распределения  цN(хi)∆хi≈pi(или n цN(хi) ∆хi≈ npi)

выравнивающую теоретическую кривую ц1 (х) (или ц2 (х)) можно построить приближенно по точкам (хi, рi) (или (хi, n рi), где в качестве значений хi (i = 1, 2, ..., m)целесообразно взять середины интервалов (см. рис. 10.6). При следует иметь в виду, что максимум выравнивающей кривой ц1 (х) (или ц2 (х))  будет в точке х = а≈ и равен

Пример 1О.12а. Имеются следующие статистические данные числе вызовов специализированных бригад скорой помощи в час некотором населенном пункте в течение 300 ч:

Подобрать соответствующее теоретические распределение и на уровне значимости б= 0,05 поверить гипотезу о согласованности двух распределений с помощью критерия Х2.

Р е ш е н и е. Вычислим выборочные среднюю и дисперсию:

Выдвигаем гипотезу Но: случайная величина Х — число вызовов скорой помощи в час — распределена по закону Пуассона с параметром л = 2,54.

В пользу этой гипотезы свидетельствует следующее:

— вызов скорой помощи для каждого жителя — событие  целом достаточно редкое;

— полигон частостей (частот) дискретной случайной величины Х(рис. 10.8) по своему виду напоминает полигон пуассоновского распределения вероятностей при небольших

значениях л (см. передний форзац учебника);

— оценки математического ожидания М(Х) и дисперсии D(Х) — выборочная средняя и выборочная дисперсия приближенно равны, т. е. (а равенство М(X) = D(X), или б=у2, характерно именно для распределения Пуассона — см. § 4.2).

В качестве неизвестного параметра л, являющегося математическим ожиданием случайной величины, расаределенной по закону Пуассона (см. § 4.2), берем его Несмещенную и состоятельную оценку по выборке — выборочную среднюю, т. е.

л = 2,54.

Вероятности значений случайной величины Х найдем по формуле (4.8):

для определения статистики Х2 составим таблицу (табл. 10.За).

При расчете Х2 объединяем последние два интервала, так как частоты (n 8=4, n 9 =1) меньше 5.

Так как новое число интервалов (с учетом объединения двух последних) m= 8, а закон Пуассона определяется, r = 1 параметром, то число степеней cвободы

k=m-r - 1 = 8 -1- 1 = 6.

табл. VПриложений X 20.05;6 =12,59. Так как X2 <X 2 0.05;6 (6,12 <12,59)то гипотеза Нo согласуется с опытными данными.

Критерий Колмогорова. На практике кроме критерия X2используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величин разности между эмпирической функцией распределения Fn(х) и соответствутощей теоретической функцией распределения

D= max |Fn(x)-F(x)|,  (10.17)

назьтваемое статистикой Критерия Колмогорова.

доказано, что какова бы ни была функция распределения F(х) непрерывной Случайной величины Х, при неограниченном увеличении числа наблюдений (n→∞) вероятность неравенства стремится к пределу

  (10.18)

Задавая уровень значимости б, из соотношения

  P(лб)=б  (10.19)

можно найти соответствующее критическое значение лб. В табл. 10.4 приводятся критические значения лб критерия Колмогорова для некоторых б.

Схема применения критерия Колмогорова следующая.

1. Строятся эмпирическая функция распределения Fn (х) и предполагаемая теоретическая функция распределения F(х).

2. Определяется мера расхождения между теоретическим и эмпирическим распределениями D по формугле (10.17) и вычисляется величина

  (10.20)

3. Если вычисленное значение . окажется больше критического лб определенного на уровне значимости а, то нулевая гипотеза Но  о том, что случайная величина Х имеет заданный закон распределения, отвергается. Если л≤ лб, то считают, что гипотеза Но не противоречит опытным данным.

Пример 10.13. По данным примера 10.12 и табл. 8.1 с помощью критерия Колмогорова на уровне значимости а = 0,05 проверить гипотезу Но о том, что случайная величина Х — выработка рабочих предприятия — имеет нормальный закон распределения с параметрами а= 119,2; у2 =87,48, т. е. N(119,2; 87,48).

Значения эмпирической функции распределения F (х), или накопленной частости, вычислены выше в табл. 8.1, а ее график приведен на рис. 8.2, б — эти значения и график воспроизводятся соответственно в табл. 10.5 и на рис. 10.9. для построения теоретической функции распределения для нормального закона воспользуемся ее выражением (4.30) через функцию Лапласа:

Например,

и т. д. Результаты вычислений сведем в табл. 10.5, а график F(х) представим на рис. [0.9.

Из рис. 10.9 следует, что

D=|Fn(118)-F(118)|=|0.410-0.449|=0.039

По формуле (10.20) величина = 0,039√100 = 0,39.

Критическое значение критерия Колмогорова по табл. 10.4 ранвно л0,05 =1,36. Так как 

л<л0,05 (0,39<1,36), то гипотеза Но согласуется с опытными данными.

Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение  возможно лишь тогда, когда теоретическая функция распределения F(х) задана полностью. Но такой случай на практике встречается весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия х2 это обстоятельство учитывается соответствующим уменьшением числа свободы. Такого рода поправок в критерии Колмогорова непредусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров и оценки, то получим завышенное значение вероятности Р(л) значит, бльшее критическое значение. В результате есть риск в ряде случаев принять нулевую гипотезу Но о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным.