9. Пример выполнения расчетно-графической работы
Пусть задана выборка
XB ={2;5;7;1;12; 5;9;6;8;6; 8;6;2;3;7; 6;8;3;8; 12; 6;7;3;9;4; 7;6;8;11;6}
объема n=30, полученная при наблюдении за случайной величиной Х (признак выборки). Заданы так же надежность g=0,95 для построения доверительных интервалов оценок параметров распределения случайной величиной Х, уровни значимости a1=0,05; a2=0,05; a3=0,014 a4=0,05 для проверки статистических гипотез.
Задание 1
1.1. Наблюдаемая выборка может представлять собой стаж работы по специальности сотрудников строительного предприятия.
1.2. Построим вариационный ряд выборки, исключив из нее повторяющиеся варианты xj и подсчитав их частоты nj. Получим так же и относительные частоты wj =nj/n. Результат приведен в таблице 2, а на рис. 2 построен полигон частот для заданной выборки
Таблица 2
xj | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | å |
nj | 1 | 2 | 3 | 1 | 2 | 7 | 4 | 5 | 2 | 0 | 1 | 2 | 30 |
wj | 0,033 | 0,067 | 0,1 | 0,033 | 0,067 | 0,233 | 0,133 | 0,167 | 0,067 | 0 | 0,03 | 0,067 | 1 |
nj*xj | 1 | 4 | 9 | 4 | 10 | 42 | 28 | 40 | 18 | 0 | 11 | 24 | 191 |
xj-Xср | -5,37 | -4,37 | -3,367 | -2,37 | -1,37 | -0,37 | 0,633 | 1,633 | 2,633 | 3,63 | 4,63 | 5,633 | |
nj*(xj-Xср)2 | 28,8 | 38,14 | 34 | 5,601 | 3,736 | 0,941 | 1,604 | 13,34 | 13,87 | 0 | 21,5 | 63,47 | 224,97 |
nj*(xj-Xср)3 | -155 | -167 | -114,5 | -13,3 | -5,11 | -0,35 | 1,016 | 21,79 | 36,52 | 0 | 99,5 | 357,5 | 62,058 |
nj*(xj-Xср)4 | 829,5 | 727,2 | 385,4 | 31,37 | 6,977 | 0,127 | 0,644 | 35,59 | 96,17 | 0 | 461 | 2014 | 4588 |

Рис.2.
1.3. Подсчитаем выборочные параметры по формулам:
Выборочное среднее
, ![]()
=6,367
Выборочную дисперсию
, ![]()
=7,499
Выборочное среднеквадратическое отклонение
,
2,738
Выборочную симметрию
, ![]()
=0,101
Выборочный эксцесс
, ![]()
- 3 = -0,28
Уточненную выборочную дисперсию
=
=7,758
Выборочный стандарт
=2,785
Задание 2
Величины Хср, Dут, S случайные и являются точечными оценками математического ожидания М[X] дисперсии D[X] и среднеквадратического отклонения s=
наблюдаемой в выборке случайной величины Х.
2.1. Предполагая, что наблюдаемая величина Х имеет нормальное распределение, построим доверительные интервалы для математического ожидания a=М[X] и среднеквадратического отклонения s=
при уровне надежности g=0,95.
Поскольку известно, что величина t=(Хср-а)
/S имеет распределение Стьюдента с n-1 степенью свободы, то решая уравнение Р( | t |<tg )=g относительно tg можно построить симметричный интервал ХВ -eg <а<ХВ +eg, в котором с вероятностью g находится математическое ожидание а. Величина eg=tgS/
представляет собой точность оценки. Решение tg=t(g,n-1) есть обращенное распределение Стьюдента, оно протабулировано и может быть найдено и таблиц, например из [1,2 приложение 3].
В рассматриваемом примере tg =t(0,95;29)=2,045 , eg = 2,045*2,758/
=1,03 и тогда доверительный интервал для математического ожидания будет 6,367 -1,03< a < 6,367+1,03 или 5,337< a < 7,397.
Для нахождения доверительного интервала оценки среднеквадратического отклонения s воспользуемся тем, что величина c=
S/s имеет распределение «Хи» с n-1 степенью свободы. Задавшись надежностью интервальной оценки g и решая уравнение P( | s - S| <eg )= g относительно eg можно построить доверительный интервал. Переходя к эквивалентному уравнению
, где qg =eg/S, найдем его решение qg =q(g,n-1) из таблиц, например [1,2 приложение 4], тогда точность оценки eg=qg S. Доверительный интервал строится таким образом:
S-eg<s<S+eg или S(1-qg)< s< S(1+qg), причем если qg< 1, то 0< s< S(1+qg).
В нашем примере qg =q(0,95,29)=0,28 тогда eg=0,28*2,785=0,78 и доверительный интервал будет следующий
2,785-0,78 < s < 2,785+0,78 или 2,005< s< 3,561.
В нем оцениваемый параметр s находится с вероятностью g=0,95
2.2. Отметим, что построенные доверительные интервалы являются областями принятия гипотез Н0={а=Хср} и Н0={s=S} при их проверке с уровнем значимости a=1-g. Теперь проверим гипотезу о равенстве математического ожидания и дисперсии наблюдаемой случайной величины указанным в задании гипотетическим значениям s=0,8S, а=1,2Хср.
Проверим сначала гипотезу о том, что истинная дисперсия наблюдаемой величины равна s=0,8S, т. е. Н0={s=0,8*2,785=2,228}. Зададимся уровнем значимости гипотезы a1=0,05 и альтернативными гипотезами Н1 ={s ¹2,228} или Н2 ={s>2,228}. Для проверки основной гипотезы воспользуемся критерием «Хи-квадрат» К=(n-1)(S/s)2.
Наблюдаемое значение критерия kнабл =(30-1) (2,785/2,228)2 =45,313. Критическая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр. л = c2кр( 1-0.025; 29) = 16,047, kкр. п= c2кр( 0.025; 29) =45,722. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается, т. е. отличие наблюдаемого значения дисперсии от гипотетического не значительны. Если в качестве альтернативной рассматривать гипотезу Н2, поскольку s <S значительно (20%), то при этом критическая область будет правосторонней, а критическую точку kкр= c2кр( 0.05; 29) =42,557 найдем из таблиц. Тогда наблюдаемое значение критерия kнабл =45,313 попадает в критическую область и проверяемая гипотеза отвергается. Результат проверки гипотезы при различных альтернативах оказался разным, в итоге гипотеза отвергается.
Проверим теперь гипотезу о том, что истинное математическое ожидание наблюдаемой величины равна а=1,2Хср, т. е. Н0={а=1,2*6,367=7,64}. Зададимся уровнем значимости гипотезы a1=0,05 и альтернативными гипотезами Н1 ={а ¹7,64} или Н2 ={а<7,64}. Для проверки основной гипотезы воспользуемся критерием Стьюдента К=(Хср-а)
/S.
Наблюдаемое значение критерия kнабл=(6,367-7,64)
/2,785=-2,504. Критическая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр. л= -Ткр(0.025; 29) = -2,045, kкр. п=Ткр(0.025; 29) = 2,045. Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается, т. е. отличие наблюдаемого значения дисперсии от гипотетического значительны. Если в качестве альтернативной рассматривать гипотезу Н2, поскольку а>Хср значительно (20%), то критическая область левосторонняя, а критическая точка
kкр= - Ткр(0.05, 29)=-1,699, тогда наблюдаемое значение критерия kнабл=-2,504 попадает в критическую область и проверяемая гипотеза опять отвергается. Результат проверки гипотезы при различных альтернативах оказался одинаковым, в итоге гипотеза отвергается.
2.3. Проверим гипотезу об однородности выборки, т. е. гипотезу о равенстве математического ожидания и дисперсии случайных величин, наблюдаемых в первой и второй половинах имеющейся выборки.
Разобьем выборку на две равные части объемов n1=15, n2=15 и вычислим по ним выборочные средние и выборочные стандарты
Хср1=5,8, Хср2=6,93, S1=2,957, S2=2,576.
Основная проверяемая гипотеза Н0={s1=s2 , а1=а2 }. Зададимся уровнем значимости гипотезы a2=0,05 и альтернативными гипотезами Н1={s1¹s2} или Н2={а1¹а2}, поскольку отличия в значениях Хср , S для разных частей выборки не существенны (менее чем 16%).
Для проверки основной гипотезы по отношению к альтернативной гипотезе Н1 воспользуемся критерием Фишера
K=
>1
Наблюдаемое значение критерия kнабл=1,317. Критическая область Ккр при альтернативной гипотезе Н1 правосторонняя, а критическую точку найдем из таблицkкр = Fкр( 0.05;15;15) =2,403. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается. Если в качестве альтернативной рассматривать гипотезу Н2, то для проверки основной гипотезы воспользуемся критерием Стьюдента
К=
,
Наблюдаемое значение критерия kнабл = -1,119. Критическая область Ккр при этом Н1 двухсторонняя, а критические точки найдем из таблиц
kкр. л = -Ткр( 0.05/2; 15+15-2) = -2,048, kкр. п = Ткр( 0.05/2; 15+15-2) = 2,048. Видим, что kнабл не принадлежит критической области и значит, гипотеза опять принимается, т. е. отличие наблюдаемых значений математического ожидания и дисперсии в первой и второй половине выборки незначительны. Гипотеза об однородности выборки принимается.
Задание 3
3.1. Построим гистограмму выборки ХВ как удобную форму представления выборочного распределения. Для этого разобьем наблюдаемый интервал значений в выборке на m равновеликих интервалов
xmin= 1; xmax= 12; m=5; D=
=2,2
Количество интервалов разбиения m выбирается исходя из свойств выборки, рекомендуется использовать формулу m=1+3,2*lg(n), m=5,73 примем m=5. Граничные точки интервалов hj=[xj , xj+1], j=1,.., m и их центры xj+0.5 вычисляем по формулам следующим образом:
xj= xmin + ( j-1)*D; xj+0.5= (xj + xj+1)/2.
Подсчитав для каждого интервала частоты попадания в него элементов выборки nj и относительные частоты wj =nj/n , сведем все результаты расчета наблюдаемых частот nj, wj в следующую таблицу3 и построим гистограмму частот рис. 3.
Таблица 3
hj | 1 - 3,2 | 3,2 - 5,4 | 5,4 - 7,6 | 7,6 - 9,8 | 9,8 - 12 | å |
xj+0.5 | 2,1 | 4,3 | 6,5 | 8,7 | 10,9 | |
nj | 6 | 3 | 11 | 7 | 3 | 30 |
wj | 0,2 | 0,1 | 0,37 | 0,23 | 0,1 | 1 |
Теоретические частоты нормальной случайной величины | ||||||
uj= | -1,55808 | -0,7547 | 0,04869 | 0,852076 | 1,655462 | |
njт= | 2,596642 | 6,57481 | 8,73068 | 6,080044 | 2,220542 | 26,20272 |
cj2 = | 4,460701 | 1,943671 | 0,589853 | 0,139196 | 0,273606 | 7,407027 |
Теоретические частоты показательной случайной величины | ||||||
njт=Dn·Lexp( - Lxj+0.5 ) | 7,454 | 5,276 | 3,735 | 2,644 | 1,871 | 21 |
cj2 = | 0,284 | 0,982 | 14,135 | 7,180 | 0,681 | 23,26 |

Рис.3.
3.2. Используя критерий согласия Пирсона, проверим гипотезу Н0={X~N(a,s)} о нормальном распределении наблюдаемой случайной величины Х с параметрами а=Хср, s=S. Для этого подсчитаем теоретические частоты попадания величины Х в интервалы hj
njт=nP(xj<Х<xj+1) =n(F (xj+1 )–F(xj)) » fX(xj+0.5) n D.
Поскольку проверяется гипотеза о нормальном распределении то fX(xj+0.5)=
j(
) , где j(u)=
- функция Гаусса.
Все результаты расчетов теоретических частот njт приведены в таблице 3 и на рис. 3, где приводится так же кривая теоретических частот.
Согласно критерия Пирсона величина суммарного отклонения наблюдаемых частот от теоретических
c2 = 
при условии справедливости основной гипотезы имеет распределение «хи-квадрат» с m-3 степенями свободы и может быть принята за критерий проверки гипотезы Н0. Задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу) a3=0,01 находим критическую точку критерия из решения уравнения
P(c2 >c2кр) =a3.
Его решения представляются обратным «хи-квадрат» распределением и находятся из таблиц c2кр=c2(a, m-3), например в [1,2 приложение 5]. Тогда критерий проверки основной гипотезы Н0 о нормальном распределении выборочного признака Х состоит в следующем:
если c2набл £ c2кр гипотеза принимается (отклонения
теоретических и наблюдаемых частот не значительны),
если c2набл > c2кр гипотеза отвергается (отклонения значительны)
В нашем примере величина c2набл рассчитана в таблице и ее значение c2набл=7,407, а c2кр=c2(0,01, 2)=9,2 . Тогда согласно критерию Пирсона гипотеза о нормальном распределении случайной величины Х принимается.
3.3. Теперь проверим гипотезу Н0 ={X ~Е( L)} о показательном распределении наблюдаемой случайной величины Х с параметром L=1/Хср.
Теоретические частоты подсчитаем исходя из вида функции плотности показательного распределения
njт » fX(xj+0.5) n D; fX(xj+0.5)= L exp( -L* xj+0.5 ) .
Рассчитанные теоретические частоты и суммарное относительное отклонение наблюдаемых и теоретических частот приводятся так же в таблице 3 и отражены на рис. 3 .
Из таблицы видно, что наблюдаемое значение критерия при проверке гипотезы c2набл=23,26 принадлежит правосторонней критической области, так как критическая точка c2кр=c2(0,01, 5-2)=11,3. Тогда согласно критерию
Пирсона гипотеза о показательном распределении наблюдаемой случайной величины Х отклоняется.
Задание 4
Пусть в опыте наблюдается одновременно значения двух случайных величин Х, Y (двух признаков). В результате получена двухмерная выборка объема n=30 приведенная в таблице 4.
4.1. Вычислим выборочные средние Хср, Yср выборочные дисперсии Dx, Dy и среднеквадратические отклонения sxв, syв по каждому из признаков (признак X рассчитан в Задании 1 )
Xср=6,367; sx=2,738; Yср=13,39; sy=4,543
Выборочный коэффициент корреляции между наблюдаемыми случайными величинами вычислим по формуле:
, где 
получим выборочное среднее произведение (XY)ср =91,943 и коэффициент корреляции rВ= 0,538.
Таблица 4.
i | X | Y | i | X | Y | i | X | Y |
1 2 3 4 5 6 7 8 9 10 | 2 5 7 1 12 5 9 6 8 6 | 14,7 4,4 19,9 5,2 14 7,9 19,6 11,3 14,2 12 | 11 12 13 14 15 16 17 18 19 20 | 8 6 2 3 7 6 8 3 8 12 | 13,3 4,9 6,5 15,1 14,8 18 20 3,8 17,7 17,5 | 21 22 23 24 25 26 27 28 29 30 | 6 7 3 9 4 7 6 8 11 6 | 9,9 17,5 6,3 17,9 15 15,3 15 12,2 12,6 14,7 |
Построим прямую линейной среднеквадратической регрессии
![]()
Вычислим коэффициенты этой прямой и получим ее уравнение
. Оно представляет собой линейное приближение уравнения регрессии
и построено методом наименьших квадратов, т. е. сумма квадратов отклонения наблюдаемых в выборке точек (xi, yi) от соответствующих точек прямой (xi,
(xi)) является минимальной среди всех возможных прямых. Построенная прямая приведена на рис. 4, на нем же приведены и точки выборки.

Рис.4.
4.2. Выборочный коэффициент корреляции rВ является случайной величиной, поэтому полученное на нашей выборке значение rВ = 0,538 может не отражать истинного значения коэффициента корреляции r(X,Y).
Проверим гипотезу о значимости выборочного коэффициента корреляции, это позволит судить о наличии корреляционной связи между признаками Х и Y. В качестве основной гипотезы возьмем предположение об отсутствии корреляции Н0={r=0}, допустим так же что двухмерная случайная величина (X,Y) имеет нормальное распределение. Примем за критерий случайную величину
Т=
,
которая, при справедливости основной гипотезы, имеет распределение Стьюдента с n-2 степенями свободы. Тогда, задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу) a4=0,05 и альтернативной гипотезой Н0={r¹0}, находим критические точки двухсторонней критической области из решения уравнения
P(t >tкр) =a4
Эти решения представляются обратным распределением Стьюдента и находятся из таблиц tкр=Ткр(a/2; n-2), например в [1,2 приложение 6]. Тогда критерий проверки основной гипотезы Н0 об отсутствии корреляции между X и Y состоит в следующем:
если |tнабл | £ tкр гипотеза принимается ( найденный коэффициент корреляции не значителен, случайно отличен от нуля),
если |tнабл | > tкр гипотеза отвергается (корреляция значительна )
В нашем примере tнабл =3,377, а tкр=Ткр(0,025,28)=2,05 и тогда согласно критерию гипотеза об отсутствии корреляции наблюдаемых случайных величин Х и Y отвергается, т. е. найденный выборочный коэффициент корреляции значим.
Литература
1. Гмурман вероятностей и математическая статистика. М., “Высшая школа”, 2001.
2. Гмурман к решению задач по теории вероятностей и математической статистике. М., “Высшая школа”, 2001.
3. , Смирнов математической статистики. М., “Наука”, 1965.
4. , Дунин-Барковский теории вероятностей и математической статистики для технических приложений. М., “Наука”, 1969.
Содержание
1. Введение……………………………………………………………..3
2. Простые и сложные статистические гипотезы ……………….…..3
3. Проверка статистических гипотез …………………………………4
4. Построение критерия проверки гипотезы …………….……..……6
5. Примеры построения критериев проверки гипотез о значении параметров распределения нормальной случайной величины ….8
6. Примеры построения критериев значимости…………………….14
7. Критерий согласия Пирсона ……………………..………….……..18
8. Задания для выполнения расчетно-графических работ ……...…..23
9. Пример выполнения расчетно-графической работы.….………....28
Литература ………………………………….…………………..…...39
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ.
Методические указания и контрольные работы
по математической статистике для студентов всех специальностей
Подписано в печать _____________ Формат 60х90 1/16 Бумага газетная. Печать офсетная. Уч. изд. л 2,0 Усл. печ. л 2,5. Тираж 300 экз.
Заказ №______
Нижегородский государственный архитектурно-строительный университет. 603600, Н. Новгород, ул. Ильинская, 65
Полиграфический центр ННГАСУ. 603600, Н. Новгород, ул. Ильинская, 65



