9. Пример выполнения расчетно-графической работы

Пусть задана выборка

XB ={2;5;7;1;12; 5;9;6;8;6; 8;6;2;3;7; 6;8;3;8; 12; 6;7;3;9;4; 7;6;8;11;6}

объема n=30, полученная при наблюдении за случайной величиной Х (признак выборки). Заданы так же надежность g=0,95 для построения доверительных интервалов оценок параметров распределения случайной величиной Х, уровни значимости a1=0,05; a2=0,05; a3=0,014 a4=0,05 для проверки статистических гипотез.

Задание 1

1.1. Наблюдаемая выборка может представлять собой стаж работы по специальности сотрудников строительного предприятия.

1.2. Построим вариационный ряд выборки, исключив из нее повторяющиеся варианты xj и подсчитав их частоты nj. Получим так же и относительные частоты wj =nj/n. Результат приведен в таблице 2, а на рис. 2 построен полигон частот для заданной выборки

Таблица 2

xj

1

2

3

4

5

6

7

8

9

10

11

12

å

nj

1

2

3

1

2

7

4

5

2

0

1

2

30

wj

0,033

0,067

0,1

0,033

0,067

0,233

0,133

0,167

0,067

0

0,03

0,067

1

nj*xj

1

4

9

4

10

42

28

40

18

0

11

24

191

xj-Xср

-5,37

-4,37

-3,367

-2,37

-1,37

-0,37

0,633

1,633

2,633

3,63

4,63

5,633

nj*(xj-Xср)2

28,8

38,14

34

5,601

3,736

0,941

1,604

13,34

13,87

0

21,5

63,47

224,97

nj*(xj-Xср)3

-155

-167

-114,5

-13,3

-5,11

-0,35

1,016

21,79

36,52

0

99,5

357,5

62,058

nj*(xj-Xср)4

829,5

727,2

385,4

31,37

6,977

0,127

0,644

35,59

96,17

0

461

2014

4588

НЕ нашли? Не то? Что вы ищете?

Рис.2.

1.3. Подсчитаем выборочные параметры по формулам:

Выборочное среднее , =6,367

Выборочную дисперсию , =7,499

Выборочное среднеквадратическое отклонение , 2,738

Выборочную симметрию , =0,101

Выборочный эксцесс , - 3 = -0,28

Уточненную выборочную дисперсию = =7,758

Выборочный стандарт =2,785

Задание 2

Величины Хср, Dут, S случайные и являются точечными оценками математического ожидания М[X] дисперсии D[X] и среднеквадратического отклонения s=наблюдаемой в выборке случайной величины Х.

2.1. Предполагая, что наблюдаемая величина Х имеет нормальное распределение, построим доверительные интервалы для математического ожидания a=М[X] и среднеквадратического отклонения s= при уровне надежности g=0,95.

Поскольку известно, что величина t=(Хср-а)/S имеет распределение Стьюдента с n-1 степенью свободы, то решая уравнение Р( | t |<tg )=g относительно tg можно построить симметричный интервал ХВ -eg <а<ХВ +eg, в котором с вероятностью g находится математическое ожидание а. Величина eg=tgS/ представляет собой точность оценки. Решение tg=t(g,n-1) есть обращенное распределение Стьюдента, оно протабулировано и может быть найдено и таблиц, например из [1,2 приложение 3].

В рассматриваемом примере tg =t(0,95;29)=2,045 , eg = 2,045*2,758/ =1,03 и тогда доверительный интервал для математического ожидания будет 6,367 -1,03< a < 6,367+1,03 или 5,337< a < 7,397.

Для нахождения доверительного интервала оценки среднеквадратического отклонения s воспользуемся тем, что величина c=S/s имеет распределение «Хи» с n-1 степенью свободы. Задавшись надежностью интервальной оценки g и решая уравнение P( | s - S| <eg )= g относительно eg можно построить доверительный интервал. Переходя к эквивалентному уравнению , где qg =eg/S, найдем его решение qg =q(g,n-1) из таблиц, например [1,2 приложение 4], тогда точность оценки eg=qg S. Доверительный интервал строится таким образом:

S-eg<s<S+eg или S(1-qg)< s< S(1+qg), причем если qg< 1, то 0< s< S(1+qg).

В нашем примере qg =q(0,95,29)=0,28 тогда eg=0,28*2,785=0,78 и доверительный интервал будет следующий

2,785-0,78 < s < 2,785+0,78 или 2,005< s< 3,561.

В нем оцениваемый параметр s находится с вероятностью g=0,95

2.2. Отметим, что построенные доверительные интервалы являются областями принятия гипотез Н0={а=Хср} и Н0={s=S} при их проверке с уровнем значимости a=1-g. Теперь проверим гипотезу о равенстве математического ожидания и дисперсии наблюдаемой случайной величины указанным в задании гипотетическим значениям s=0,8S, а=1,2Хср.

Проверим сначала гипотезу о том, что истинная дисперсия наблюдаемой величины равна s=0,8S, т. е. Н0={s=0,8*2,785=2,228}. Зададимся уровнем значимости гипотезы a1=0,05 и альтернативными гипотезами Н1 ={s ¹2,228} или Н2 ={s>2,228}. Для проверки основной гипотезы воспользуемся критерием «Хи-квадрат» К=(n-1)(S/s)2.

Наблюдаемое значение критерия kнабл =(30-1) (2,785/2,228)2 =45,313. Критическая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр. л = c2кр( 1-0.025; 29) = 16,047, kкр. п= c2кр( 0.025; 29) =45,722. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается, т. е. отличие наблюдаемого значения дисперсии от гипотетического не значительны. Если в качестве альтернативной рассматривать гипотезу Н2, поскольку s <S значительно (20%), то при этом критическая область будет правосторонней, а критическую точку kкр= c2кр( 0.05; 29) =42,557 найдем из таблиц. Тогда наблюдаемое значение критерия kнабл =45,313 попадает в критическую область и проверяемая гипотеза отвергается. Результат проверки гипотезы при различных альтернативах оказался разным, в итоге гипотеза отвергается.

Проверим теперь гипотезу о том, что истинное математическое ожидание наблюдаемой величины равна а=1,2Хср, т. е. Н0={а=1,2*6,367=7,64}. Зададимся уровнем значимости гипотезы a1=0,05 и альтернативными гипотезами Н1 ={а ¹7,64} или Н2 ={а<7,64}. Для проверки основной гипотезы воспользуемся критерием Стьюдента К=(Хср-а)/S.

Наблюдаемое значение критерия kнабл=(6,367-7,64)/2,785=-2,504. Критическая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр. л= -Ткр(0.025; 29) = -2,045, kкр. п=Ткр(0.025; 29) = 2,045. Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается, т. е. отличие наблюдаемого значения дисперсии от гипотетического значительны. Если в качестве альтернативной рассматривать гипотезу Н2, поскольку а>Хср значительно (20%), то критическая область левосторонняя, а критическая точка

kкр= - Ткр(0.05, 29)=-1,699, тогда наблюдаемое значение критерия kнабл=-2,504 попадает в критическую область и проверяемая гипотеза опять отвергается. Результат проверки гипотезы при различных альтернативах оказался одинаковым, в итоге гипотеза отвергается.

2.3. Проверим гипотезу об однородности выборки, т. е. гипотезу о равенстве математического ожидания и дисперсии случайных величин, наблюдаемых в первой и второй половинах имеющейся выборки.

Разобьем выборку на две равные части объемов n1=15, n2=15 и вычислим по ним выборочные средние и выборочные стандарты

Хср1=5,8, Хср2=6,93, S1=2,957, S2=2,576.

Основная проверяемая гипотеза Н0={s1=s2 , а1=а2 }. Зададимся уровнем значимости гипотезы a2=0,05 и альтернативными гипотезами Н1={s1¹s2} или Н2={а1¹а2}, поскольку отличия в значениях Хср , S для разных частей выборки не существенны (менее чем 16%).

Для проверки основной гипотезы по отношению к альтернативной гипотезе Н1 воспользуемся критерием Фишера

K=>1

Наблюдаемое значение критерия kнабл=1,317. Критическая область Ккр при альтернативной гипотезе Н1 правосторонняя, а критическую точку найдем из таблицkкр = Fкр( 0.05;15;15) =2,403. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается. Если в качестве альтернативной рассматривать гипотезу Н2, то для проверки основной гипотезы воспользуемся критерием Стьюдента

К= ,

Наблюдаемое значение критерия kнабл = -1,119. Критическая область Ккр при этом Н1 двухсторонняя, а критические точки найдем из таблиц

kкр. л = -Ткр( 0.05/2; 15+15-2) = -2,048, kкр. п = Ткр( 0.05/2; 15+15-2) = 2,048. Видим, что kнабл не принадлежит критической области и значит, гипотеза опять принимается, т. е. отличие наблюдаемых значений математического ожидания и дисперсии в первой и второй половине выборки незначительны. Гипотеза об однородности выборки принимается.

Задание 3

3.1. Построим гистограмму выборки ХВ как удобную форму представления выборочного распределения. Для этого разобьем наблюдаемый интервал значений в выборке на m равновеликих интервалов

xmin= 1; xmax= 12; m=5; D= =2,2

Количество интервалов разбиения m выбирается исходя из свойств выборки, рекомендуется использовать формулу m=1+3,2*lg(n), m=5,73 примем m=5. Граничные точки интервалов hj=[xj , xj+1], j=1,.., m и их центры xj+0.5 вычисляем по формулам следующим образом:

xj= xmin + ( j-1)*D; xj+0.5= (xj + xj+1)/2.

Подсчитав для каждого интервала частоты попадания в него элементов выборки nj и относительные частоты wj =nj/n , сведем все результаты расчета наблюдаемых частот nj, wj в следующую таблицу3 и построим гистограмму частот рис. 3.

Таблица 3

hj

1 - 3,2

3,2 - 5,4

5,4 - 7,6

7,6 - 9,8

9,8 - 12

å

xj+0.5

2,1

4,3

6,5

8,7

10,9

nj

6

3

11

7

3

30

wj

0,2

0,1

0,37

0,23

0,1

1

Теоретические частоты нормальной случайной величины

uj=

-1,55808

-0,7547

0,04869

0,852076

1,655462

njт=j(uj)

2,596642

6,57481

8,73068

6,080044

2,220542

26,20272

cj2 =

4,460701

1,943671

0,589853

0,139196

0,273606

7,407027

Теоретические частоты показательной случайной величины

njт=Dn·Lexp( - Lxj+0.5 )

7,454

5,276

3,735

2,644

1,871

21

cj2 =

0,284

0,982

14,135

7,180

0,681

23,26


Рис.3.

3.2. Используя критерий согласия Пирсона, проверим гипотезу Н0={X~N(a,s)} о нормальном распределении наблюдаемой случайной величины Х с параметрами а=Хср, s=S. Для этого подсчитаем теоретические частоты попадания величины Х в интервалы hj

njт=nP(xj<Х<xj+1) =n(F (xj+1 )–F(xj)) » fX(xj+0.5) n D.

Поскольку проверяется гипотеза о нормальном распределении то fX(xj+0.5)=j() , где j(u)= - функция Гаусса.

Все результаты расчетов теоретических частот njт приведены в таблице 3 и на рис. 3, где приводится так же кривая теоретических частот.

Согласно критерия Пирсона величина суммарного отклонения наблюдаемых частот от теоретических

c2 =

при условии справедливости основной гипотезы имеет распределение «хи-квадрат» с m-3 степенями свободы и может быть принята за критерий проверки гипотезы Н0. Задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу) a3=0,01 находим критическую точку критерия из решения уравнения

P(c2 >c2кр) =a3.

Его решения представляются обратным «хи-квадрат» распределением и находятся из таблиц c2кр=c2(a, m-3), например в [1,2 приложение 5]. Тогда критерий проверки основной гипотезы Н0 о нормальном распределении выборочного признака Х состоит в следующем:

если c2набл £ c2кр гипотеза принимается (отклонения

теоретических и наблюдаемых частот не значительны),

если c2набл > c2кр гипотеза отвергается (отклонения значительны)

В нашем примере величина c2набл рассчитана в таблице и ее значение c2набл=7,407, а c2кр=c2(0,01, 2)=9,2 . Тогда согласно критерию Пирсона гипотеза о нормальном распределении случайной величины Х принимается.

3.3. Теперь проверим гипотезу Н0 ={X ~Е( L)} о показательном распределении наблюдаемой случайной величины Х с параметром L=1/Хср.

Теоретические частоты подсчитаем исходя из вида функции плотности показательного распределения

njт » fX(xj+0.5) n D; fX(xj+0.5)= L exp( -L* xj+0.5 ) .

Рассчитанные теоретические частоты и суммарное относительное отклонение наблюдаемых и теоретических частот приводятся так же в таблице 3 и отражены на рис. 3 .

Из таблицы видно, что наблюдаемое значение критерия при проверке гипотезы c2набл=23,26 принадлежит правосторонней критической области, так как критическая точка c2кр=c2(0,01, 5-2)=11,3. Тогда согласно критерию

Пирсона гипотеза о показательном распределении наблюдаемой случайной величины Х отклоняется.

Задание 4

Пусть в опыте наблюдается одновременно значения двух случайных величин Х, Y (двух признаков). В результате получена двухмерная выборка объема n=30 приведенная в таблице 4.

4.1. Вычислим выборочные средние Хср, Yср выборочные дисперсии Dx, Dy и среднеквадратические отклонения sxв, syв по каждому из признаков (признак X рассчитан в Задании 1 )

Xср=6,367; sx=2,738; Yср=13,39; sy=4,543

Выборочный коэффициент корреляции между наблюдаемыми случайными величинами вычислим по формуле:

, где

получим выборочное среднее произведение (XY)ср =91,943 и коэффициент корреляции rВ= 0,538.

Таблица 4.

i

X

Y

i

X

Y

i

X

Y

1

2

3

4

5

6

7

8

9

10

2

5

7

1

12

5

9

6

8

6

14,7

4,4

19,9

5,2

14

7,9 19,6 11,3 14,2

12

11

12

13

14

15

16

17

18

19

20

8

6

2

3

7

6

8

3

8

12

13,3

4,9

6,5

15,1

14,8

18

20

3,8

17,7

17,5

21

22

23

24

25

26

27

28

29

30

6

7

3

9

4

7

6

8

11

6

9,9

17,5

6,3

17,9

15

15,3

15

12,2

12,6

14,7

Построим прямую линейной среднеквадратической регрессии

Вычислим коэффициенты этой прямой и получим ее уравнение . Оно представляет собой линейное приближение уравнения регрессии и построено методом наименьших квадратов, т. е. сумма квадратов отклонения наблюдаемых в выборке точек (xi, yi) от соответствующих точек прямой (xi, (xi)) является минимальной среди всех возможных прямых. Построенная прямая приведена на рис. 4, на нем же приведены и точки выборки.

Рис.4.

4.2. Выборочный коэффициент корреляции rВ является случайной величиной, поэтому полученное на нашей выборке значение rВ = 0,538 может не отражать истинного значения коэффициента корреляции r(X,Y).

Проверим гипотезу о значимости выборочного коэффициента корреляции, это позволит судить о наличии корреляционной связи между признаками Х и Y. В качестве основной гипотезы возьмем предположение об отсутствии корреляции Н0={r=0}, допустим так же что двухмерная случайная величина (X,Y) имеет нормальное распределение. Примем за критерий случайную величину

Т=,

которая, при справедливости основной гипотезы, имеет распределение Стьюдента с n-2 степенями свободы. Тогда, задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу) a4=0,05 и альтернативной гипотезой Н0={r¹0}, находим критические точки двухсторонней критической области из решения уравнения

P(t >tкр) =a4

Эти решения представляются обратным распределением Стьюдента и находятся из таблиц tкр=Ткр(a/2; n-2), например в [1,2 приложение 6]. Тогда критерий проверки основной гипотезы Н0 об отсутствии корреляции между X и Y состоит в следующем:

если |tнабл | £ tкр гипотеза принимается ( найденный коэффициент корреляции не значителен, случайно отличен от нуля),

если |tнабл | > tкр гипотеза отвергается (корреляция значительна )

В нашем примере tнабл =3,377, а tкр=Ткр(0,025,28)=2,05 и тогда согласно критерию гипотеза об отсутствии корреляции наблюдаемых случайных величин Х и Y отвергается, т. е. найденный выборочный коэффициент корреляции значим.

Литература

1. Гмурман вероятностей и математическая статистика. М., “Высшая школа”, 2001.

2. Гмурман к решению задач по теории вероятностей и математической статистике. М., “Высшая школа”, 2001.

3. , Смирнов математической статистики. М., “Наука”, 1965.

4. , Дунин-Барковский теории вероятностей и математической статистики для технических приложений. М., “Наука”, 1969.

Содержание

1.  Введение……………………………………………………………..3

2.  Простые и сложные статистические гипотезы ……………….…..3

3.  Проверка статистических гипотез …………………………………4

4.  Построение критерия проверки гипотезы …………….……..……6

5.  Примеры построения критериев проверки гипотез о значении параметров распределения нормальной случайной величины ….8

6.  Примеры построения критериев значимости…………………….14

7.  Критерий согласия Пирсона ……………………..………….……..18

8.  Задания для выполнения расчетно-графических работ ……...…..23

9.  Пример выполнения расчетно-графической работы.….………....28

Литература ………………………………….…………………..…...39

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

Методические указания и контрольные работы

по математической статистике для студентов всех специальностей

Подписано в печать _____________ Формат 60х90 1/16 Бумага газетная. Печать офсетная. Уч. изд. л 2,0 Усл. печ. л 2,5. Тираж 300 экз.

Заказ №______

Нижегородский государственный архитектурно-строительный университет. 603600, Н. Новгород, ул. Ильинская, 65

Полиграфический центр ННГАСУ. 603600, Н. Новгород, ул. Ильинская, 65