Пример. Для эмпирического распределения рабочих цеха по выработке по данным первых двух граф табл. 8.1 подобрать соответствующее теоретическое распределение и на уровне значимости б = 0,05 проверить гипотезу о согласованности двух распределений с помощью критерия Х2
Р е ш е н и е.
По виду гистограммы распределения рабочих по выработке (рис. 10.7)можно предположить нормальный закон распределения признака. Параметры нормального закона б и у2 являющиеся соответственно математическим
ожиданием и дисперсией случайной величины Х, неизвестны, поэтому заменяем их «наилучшими» оценками по выборке — несмещенными и состоятельными оценками соответственно выборочной средней ![]()
«исправленной» выборочной дисперсией ![]()
Так как число наблюдений n= 100 достаточно велико, то вместо «исправленной» ![]()
можно взять «обычную» выборочную дисперсию ![]()
В примере 8.8 вычислены ![]()
=119,2(%),![]()
=87,48, S= 9,35(%).
Итак, выдвигаемая гипотеза Нo: случайная величина Х — выработка рабочих цеха — распределена нормально с параметрами б= 119,2; у2= 87,48, т. е. Х~ N(1 19,2; 87,48).
Для расчета вероятностей рi попадания случайной величины Х в интервал [хi, xi+1] используем функцию Лапласа в соответствии со свойством нормального распределения:
![]()
Например ![]()
![]()
и соответствующая первому интервалу теоретическая частота nрi=100*0.0166 ≈ 1,7 и т. д.
Для определения статистики Х2 удобно составить таблицу (табл. 10.3).
Учитывая, что в рассматриваемом эмпирическом распределении частоты первого и последнего интервалов (n1 =3 , n8 = 2) меньше 5, при использовании критерия Х2Пирсона в соответствии с замечанием на с. 359 целесообразно объединить указанные интервалы с соседними (см. табл. 10.3).
Итак, фактически наблюдаемое значение статистики Х2= 2,27.
Так как новое число интервалов (с учетом объединения крайних) m = 6, а нормальный закон распределения определяется r = 2параметрами, то число степеней свободы k = m — г — 1 == 6—2—1 =3. Cоответствующее критическое значение статистики Х2 по табл.
V приложений Х20.05;3= 7,82. Так как Х2< Х20,05;3, то гипотеза о выбранном теоретическом нормальном законе N( 119,2; 87,48) согласуется с опытными данными.
З а м е ч а н и е. Для графического изображения эмпирического и выравнивающего его теоретического нормального распределений необходимо использовать одинаковый для двух распределений масштаб по оси ординат.
Так, если при построении гистограммы эмпирического распределения по оси ординат откладывать плотность частости ![]()
(где ni — частота i-го интервала (i = 1, 2, ..., m), ∆x — величина интервала, m — число интервалов, n — число наблюдений, объем выборки), то выравнивать такую гистограмму будет теоретическая нормальная кривая с плотностью ![]()
, где в качестве параметров б и у2 используются их состоятельные и несмещенные выборочные оценки: соответственно средняя ![]()
дисперсия ![]()
(либо ![]()
= ![]()
при больших n).
Для построения кривой ![]()
(х) можно использовать таблицу плотности вероятности стандартного нормального распределения (табл. 1 приложений) в соответствии с формулой
![]()
При равенстве величин всех интервалов (как в примере 10.12) часто бывает удобнее при построения гистограммы эмпирического распределения по оси ординат откладывать частости ![]()
(см. рис. 10.7)или частоты ni,. В этом случае выравнивающей гистограмму кривой будет растянутая (сжатая) вдоль оси ординат в ∆х раз нормальная кривая, т. е. кривая ц1(х) = цN(х)∆х (или кривая ц2(х) = цN(х)n∆х).
Точное построение выравнивающей кривой ц1 (х) (или ц2(x)) связано с проведением дополнительных расчетов. Их можно избежать используя п р и б л и ж е н н ы й способ построения (см. рис. 10.7) В процессе применения Х2-критерия Пирсона были вычислены вероятности рi, и теоретические частоты nрi, интервалов распределения. Учитывая, что в соответствии со свойствами плотности распределения цN(хi)∆хi≈pi(или n цN(хi) ∆хi≈ npi)
выравнивающую теоретическую кривую ц1 (х) (или ц2 (х)) можно построить приближенно по точкам (хi, рi) (или (хi, n рi), где в качестве значений хi (i = 1, 2, ..., m)целесообразно взять середины интервалов (см. рис. 10.6). При следует иметь в виду, что максимум выравнивающей кривой ц1 (х) (или ц2 (х)) будет в точке х = а≈ ![]()
и равен
![]()
Пример 1О.12а. Имеются следующие статистические данные числе вызовов специализированных бригад скорой помощи в час некотором населенном пункте в течение 300 ч:

Подобрать соответствующее теоретические распределение и на уровне значимости б= 0,05 поверить гипотезу о согласованности двух распределений с помощью критерия Х2.
Р е ш е н и е. Вычислим выборочные среднюю и дисперсию:

Выдвигаем гипотезу Но: случайная величина Х — число вызовов скорой помощи в час — распределена по закону Пуассона с параметром л = 2,54.
В пользу этой гипотезы свидетельствует следующее:
— вызов скорой помощи для каждого жителя — событие целом достаточно редкое;
— полигон частостей (частот) дискретной случайной величины Х(рис. 10.8) по своему виду напоминает полигон пуассоновского распределения вероятностей при небольших
значениях л (см. передний форзац учебника);
— оценки математического ожидания М(Х) и дисперсии D(Х) — выборочная средняя и выборочная дисперсия приближенно равны, т. е. ![]()
(а равенство М(X) = D(X), или б=у2, характерно именно для распределения Пуассона — см. § 4.2).
В качестве неизвестного параметра л, являющегося математическим ожиданием случайной величины, расаределенной по закону Пуассона (см. § 4.2), берем его Несмещенную и состоятельную оценку по выборке — выборочную среднюю, т. е.
л ![]()
= 2,54.
Вероятности значений случайной величины Х найдем по формуле (4.8):
![]()
для определения статистики Х2 составим таблицу (табл. 10.За).
При расчете Х2 объединяем последние два интервала, так как частоты (n 8=4, n 9 =1) меньше 5.
Так как новое число интервалов (с учетом объединения двух последних) m= 8, а закон Пуассона определяется, r = 1 параметром, то число степеней cвободы
k=m-r - 1 = 8 -1- 1 = 6.
табл. VПриложений X 20.05;6 =12,59. Так как X2 <X 2 0.05;6 (6,12 <12,59)то гипотеза Нo согласуется с опытными данными.
Критерий Колмогорова. На практике кроме критерия X2используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величин разности между эмпирической функцией распределения Fn(х) и соответствутощей теоретической функцией распределения
D= max |Fn(x)-F(x)|, (10.17)
назьтваемое статистикой Критерия Колмогорова.
доказано, что какова бы ни была функция распределения F(х) непрерывной Случайной величины Х, при неограниченном увеличении числа наблюдений (n→∞) вероятность неравенства ![]()
стремится к пределу
![]()
(10.18)
Задавая уровень значимости б, из соотношения
P(лб)=б (10.19)
можно найти соответствующее критическое значение лб. В табл. 10.4 приводятся критические значения лб критерия Колмогорова для некоторых б.
Схема применения критерия Колмогорова следующая.
1. Строятся эмпирическая функция распределения Fn (х) и предполагаемая теоретическая функция распределения F(х).
2. Определяется мера расхождения между теоретическим и эмпирическим распределениями D по формугле (10.17) и вычисляется величина
![]()
(10.20)
3. Если вычисленное значение ![]()
. окажется больше критического лб определенного на уровне значимости а, то нулевая гипотеза Но о том, что случайная величина Х имеет заданный закон распределения, отвергается. Если л≤ лб, то считают, что гипотеза Но не противоречит опытным данным.
Пример 10.13. По данным примера 10.12 и табл. 8.1 с помощью критерия Колмогорова на уровне значимости а = 0,05 проверить гипотезу Но о том, что случайная величина Х — выработка рабочих предприятия — имеет нормальный закон распределения с параметрами а= 119,2; у2 =87,48, т. е. N(119,2; 87,48).
Значения эмпирической функции распределения F (х), или накопленной частости, вычислены выше в табл. 8.1, а ее график приведен на рис. 8.2, б — эти значения и график воспроизводятся соответственно в табл. 10.5 и на рис. 10.9. для построения теоретической функции распределения для нормального закона воспользуемся ее выражением (4.30) через функцию Лапласа:
![]()
Например, ![]()
![]()
и т. д. Результаты вычислений сведем в табл. 10.5, а график F(х) представим на рис. [0.9.

Из рис. 10.9 следует, что
D=|Fn(118)-F(118)|=|0.410-0.449|=0.039
По формуле (10.20) величина ![]()
= 0,039√100 = 0,39.
Критическое значение критерия Колмогорова по табл. 10.4 ранвно л0,05 =1,36. Так как
л<л0,05 (0,39<1,36), то гипотеза Но согласуется с опытными данными.
Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения F(х) задана полностью. Но такой случай на практике встречается весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия х2 это обстоятельство учитывается соответствующим уменьшением числа свободы. Такого рода поправок в критерии Колмогорова непредусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров и оценки, то получим завышенное значение вероятности Р(л) значит, бльшее критическое значение. В результате есть риск в ряде случаев принять нулевую гипотезу Но о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным.


