Методический материал для выполнения домашней работы по математической статистике
Часть I. Моделирование выборки
1. Из таблицы случайных чисел (смотри ниже) выбираем 101 значение:
(4 блока + 1 число). Имеем равномерное распределение на промежутке (0;1) – делим каждое значение из таблицы. на 100.
2. По рекуррентной формуле получаем новые значения (стандартное нормальное распределение):

3. Задаем два числа, это условие: “ m = ” “s = ” ( s > 0) – например, m = 0.3, s = 3).
Впоследствии: m – это генеральная среднее Х, а
- это генеральная дисперсия Х.
Строим генеральную выборку:
,где i=1,2,...,100
Получили: Х – генеральная совокупность
4. Контроль: по выборке необходимо вычислить:
o
- выборочное среднее
o
- выборочная дисперсия
o
(исправленная дисперсия) [
]
o
-центрированная дисперсия
Если
, то можно продолжать работу. В противном случае, необходимо заменить начальные значения.
Равномерно распределенные случайные числа
98 50
11 52
83 68
88 29
99 23
65 40
80 14
74 96
69 94
09 54
91 37
80 42
44 22
12 28
63 07
61 42
15 33
94 92
42 25
23 05
04 65
00 23
35 90
59 78
46 70
32 85
69 97
19 84
45 20
94 05
98 35
33 37
80 94
79 00
18 77
74 80
54 36
11 88
48 25
69 35 01
Часть II. Обработка выборки. Группированный статистический ряд
Составляем вариационный ряд Находим медиану. В нашем случае – это среднее арифметическое 50го и 51го членов вариационного ряда. Находим размах выборки:
Длина каждого интервала: 7. Разделите вариационный ряд в соответствии с границами интервалов и определите частоту (абсолютную) попаданий значений Х в соответствующие интервалы.
8. Заполните следующую таблицу (группированный статистический ряд)
N | Интервал | штрихи | Ni(абс. частота) | Zi(серед. инт) | Pi*(отн. част.) | Накопл. Част. |
1 | [Xmin;a1) | || | n1 | z1 |
| |
2 | [a1;a2) | || | n2 | z2 |
| |
3 | [a2;a3) | |||||| | n3 | z3 |
| |
4 | [a3;a4) | |||||||||| | n4 | z4 | ||
5 | ||||||
6 | ||||||
8 | [a7;Xmax) | || | n8 | z8 | 1 | |
|
|
9. Статистический ряд
Zi | Z1 | z2 | z3 | z4 | z5 | z6 | z7 ……. | z8 |
Pi* |
|
|
|
|
|
|
|
|
Определяем моду: 
10. Полигон частот:
11. Статистическая функция распределения: 

-приближенная функция распределения исследуемой генеральной совокупности

Гистограмма выборки (оценка кривой функции плотности генеральной совокупности Х). Строим дополнительную таблицу: N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Hi=Pi*/D Высота прямоугольника |
|
|
|
|
|
|
|
|
Часть III. Вычисление выборочных характеристик
Линейное преобразование выборки.Введем новую случайную величину:
. Пусть Мо=
(например, k=5).
z1 | z2 | z3 | z4 | z5 | z6 | z7 | z8 | |
| -4 | -3 | -2 | -1 | 0 | 1 | 2 | 3 |
|
|
|
|
|
|
|
|
|
Замечание: 
Методом произведений (или методом сумм) необходимо вычислить:
Вычисление выборочного среднего:
Необходимо сравнить
с первоначальным вычислением по всей выборке.
: - Выборочная дисперсия генеральной совокупности Х:
Вычисление нормированных центральных выборочных моментов
, w3= v3 – 3v1v2 + 2v13 ,
, w3= v4 – 4v1v3 + 6v12v2 – 3v14
Числовые характеристики | По выборке | По группированной выборке |
| ||
| ||
| ||
| ||
| ||
| ||
| ||
A | Не вычислять | |
E | Не вычислять |
Сделать краткий анализ полученных результатов
Глава IV. Построение доверительных интервалов
Построение доверительного интервала для математического ожидания при известной дисперсии.Дано:
- нормальное распределение.
Построить доверительный интервал для математического ожидания:
Решение:
o Рассмотрим стандартную нормальную величину :
; zÎN(0;1).
o Тогда, для нормально распределенной с. в. при Ф(z) = 
получим
o 

a/2 a/2
- zp zp
Примечание:
Поставьте вопрос: Каким должен быть объем выборки n, чтобы ![]()
Дано:
- нормальное распределение. Т. к s неизвестная величина, то используем исправленную выборочную дисперсию
Построить доверительный интервал для математического ожидания:
Решение:
o
Рассмотрим случайную величину
- распределение Стьюдента, число степеней свободы k = n-1.
o Используем t - распределенную c. в.
o 
Дано:
o
нормальное распределение.
o m – смотри условие; n= 100; ![]()
o Доверительная вероятность:
0.95
Найти доверительный интервал для дисперсии:
Решение:
- Рассмотрим случайную величину:
- По таблице распределения Пирсона

Дано:
o
нормальное распределение.
o N=100;
- исправленная выборочная дисперсия
o Доверительная вероятность:
0.95
Найти доверительный интервал для дисперсии:
Решение:
- Рассмотрим случайную величину
с (n-1) степенями свободы; k = n-1 = 99.
- По таблице распределения Пирсона найдем :

Часть V. Проверка статистических гипотез. Критерий значимости
Задача 1. Проверка гипотезы о значении математического ожидания m
(генеральной средней) при известном s
Дано:
- XÎN(m;s) – нормальное распределение
Ho – Нулевая гипотеза - ![]()
H1(1) – Альтернативная гипотеза (двусторонняя) - ![]()
Также нужно выбрать одну из односторонних гипотез, а именно: Если
то имеем правостороннюю гипотезу H1(2) -
. Если
то имеем левостороннюю гипотезу H1(3) - 
Решение:
Статистика критерия:
- Для двусторонней гипотезы H1(1) :

-
Правила принятия решения: Если
Ф(zкрит) = (1 - a)/2, то нет основания отвергнуть гипотезу Но на уровне значимости a. А если
то мы попадаем в критическую область и гипотезу Но на уровне значимости a отвергаем.
- Для правосторонней гипотезы H1(2):

Правило принятия решения:
Если
Ф(zкрит) =a)/2, то нет основания отвергнуть гипотезу Но на уровне значимости a. А если
то мы попадаем в критическую область и гипотезу Но на уровне значимости a отвергаем.

-
Правило принятия решения: Если
, Ф(zкрит) =a)/2, то нет основания отклонить гипотезу Но на уровне значимости a. А если
то мы попадаем в критическую область и гипотезу Но на уровне значимости a отвергаем.
Задача №2. Проверка гипотезы о значении математического ожидания
(генеральной средней) при неизвестном s
Дано:
- XÎN(m;s) – нормальное распределение
Нулевая гипотеза : Но:
Альтернативные гипотезы:
- H1(1):
Решение:
Статистика критерия:- Для двусторонней гипотезы H1(1) :
- границы критической области.

- Zкр1 Zкр2
Правило принятия решения: Если
то нет основания отклонить гипотезу Но на уровне значимости a А если 
то мы попадаем в критическую область и гипотезу Но на уровне значимости a отвергаем
- Для правосторонней гипотезы H1(2):

Правило принятия решения: Если ![]()
то нет основания отклонить гипотезу Но на уровне значимости a. А если ![]()
то мы попадаем в критическую область и гипотезу Но на уровне значимости a отвергаем.
- Для левосторонней гипотезы H1(3):

![]()
- Zкр
Правило принятия решения: Если ![]()
то нет основания отклонить гипотезу Но на уровне значимости a. А если ![]()
то мы попадаем в критическую область и гипотезу Но на уровне значимости a отвергаем
Задача №3. Проверка гипотезы о числовом значении дисперсии генеральной совокупности при известном значении математического ожидания генеральной совокупности
Дано:
- XÎN(m;s) – нормальное распределение
Нулевая гипотеза Но:
Альтернативные гипотезы:
- H1(1):
Решение:
Статистика критерия:
Для двусторонней гипотезы: H1(1):
Критические точки распределения ![]()
Правило принятия решения: Если
, то нет основания отклонить гипотезу Но на уровне значимости a. А если,
, то гипотезу Но отвергаем на уровне значимости a.
o Для правосторонней гипотезы: H1(2):
: 
![]() |
Правило принятия решения: Если
, то нет основания отклонить гипотезу Но на уровне значимости a.. А если,
, то гипотезу Но отвергаем на уровне значимости a.
o Для левосторонней гипотезы: H1(3):
: 

Правило принятия решения: Если
, то нет основания отклонить гипотезу Но на уровне значимости a. А если,
, то гипотезу Но отвергаем на уровне значимости a.
Задача №4. Проверка гипотезы о числовом значении дисперсии генеральной совокупности при неизвестном значении математического ожидания
Дано:
- XÎN(m;s) – нормальное распределение
Нулевая гипотеза Но:
Альтернативные гипотезы:
- H1(1):
Решение:
1. Статистика критерия:
- распределение
с числом степеней свободы n=49.
2. Далее решение аналогично решению задачи №3
Задача 5. Проверка гипотезы о сравнении двух средних нормальных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
Дано: Из исходной генеральной совокупности объемом 100 образовать две выборки Х и Y объемами 25. Для построения таких выборок можно воспользоваться либо датчиком случайных чисел, либо выбором четных и нечетных номеров исходной совокупности.
Так как нет основания считать дисперсии каждой из выборок одинаковыми, то прежде, чем сравнивать их средние, необходимо по критерию Фишера - Снедекора проверить гипотезу о равенстве дисперсий.
I) Задача о сравнении двух дисперсий нормальных совокупностей.
По независимым выборкам Х и Y, объемы 25 ( n1 = n2 ), находим исправленные выборочные дисперсии
и
. Ставится задача сравнить эти дисперсии (гипотеза о их равенстве) при некотором уровне значимости a.
Нулевая гипотеза: Но : D(X) = D(Y)
Конкурирующая гипотеза Н1 : D(X) > D(Y)
(односторонняя область)
Решение. Для того, чтобы при заданном уровне значимости a проверить нулевую гипотезу надо вычислить наблюдаемое значение критерия Fнаб.=
(отношение большей исправленной дисперсии к меньшей ) и по таблице критических точек распределения Фишера - Снедекора по заданному уровню значимости a с числом степеней свободы k1 = n1–1, k2 = n2–1 (где k1 – число степеней свободы большей исправленной дисперсии) найти по таблице F – распределения критическую точку
Fкрит(a, k1, k2).
Если выполняется неравенство Fнаб < Fкрит, то нет основания отвергнуть нулевую гипотезу, а если выполняется неравенство Fнаб > Fкрит, то нулевую гипотезу отвергают.
Нулевая гипотеза: Но : D(X) = D(Y)
Конкурирующая гипотеза Н1 : D(X) ¹ D(Y)
(двухсторонняя область).
Решение. Находим из таблицы Фишера - Снедекора критическую точку
Fкрит(a/2,k1,k2)
по заданному уровню значимости a/2 и числу степеней свободы k1= n1 –1, k2 = n2 –1
(где k1 – число степеней свободы большей исправленной дисперсии ). Если выполняется неравенство Fнаб < Fкрит, то нет основания отвергнуть нулевую гипотезу, а если выполняется условие Fнаб > Fкрит, то нулевую гипотезу отвергают.
II) Задача о сравнении двух средних нормальных совокупностей, дисперсии которых неизвестны и одинаковы.
В работе рассматривается только гипотеза о неравенстве средних значений.
Нулевая гипотеза Но : m Х = m Y
Альтернативной гипотезе Н1 : | m Х - m Y | > 0.
(двухсторонняя область).
Для оценки m Х и m Y используем их наилучшие оценки
и
, а для оценки s2 используем исправленные выборочные дисперсии
![]()
n)2
![]()
n)2![]()
Так как генеральные совокупности X и Y имеют одинаковые дисперсии, то для оценки s2 целесообразно использовать результаты обоих выборок. Можно показать, что лучшей оценкой для s2 в данном случае является
=
(средняя взвешенная).
Если гипотеза Но справедлива, то случайная величина (
-
) подчиняется нормальному закону распределения с параметрами (0,s2(1/n1 + 1/n2)), т. к.
m (
-
) = m (
) – m (
) = 0,
s2(
-
)= s2 (
) + s2 (
)=s2/n1 + s2/n2 =s2(1/ n1 + 1/n2)
Т. к. s2 неизвестна, то в качестве статистики для оценки дисперсии s2(
-
)
принимается несмещенная оценка
.
Статистика t =
[(
-
)- М(
-
)]/ ![]()
имеет t – распределение c число степеней свободы k = n1 + n2 -2.
Если гипотеза Но справедлива (средние равны), то статистику t можно записать в виде
t = (
-
) / ![]()
По выбранной надежности g = 1 - a, по таблице распределения Стьюдента определить критическое значение
, для которого
![]()
Если вычисленное значение 
то с надежностью g = 1 - a расхождение средних можно считать значимым (неслучайным) и гипотеза о равенстве отвергается; в противном случае, считать, что расхождение незначимо, нельзя и гипотеза о равенстве средних принимается.
Часть VI. Проверка гипотезы о нормальном распределении. Критерий ![]()
Задача 1. Приближенная проверка гипотезы нормальности распределения с помощью асимметрии и эксцесса. Асимптотический подход.
Известны приближенные значения средних квадратических отклонений асимметрии А и эксцесса Е для случая нормального генерального распределения
s (А) =
s (Е) = ![]()
Используя известный результат для нормального распределения
Р( ê Х - mï< l s) = 2Ф(l)
получаем
Р( ê А ï> l s(А) или ê Е ï> l s(E) ) £ Р( ê А ï> l s(А) + P( ê Е ï> l s(E) ) =
= 1 - 2Ф(l) + 1 - 2Ф(l) =Ф(l)) = 1- p = a
Отсюда
Ф(l) = 0.5 – 0.25a
Тогда
l = Ф-1 (0.5 – 0.25a)
Если произойдет хотя бы одно из событий
ê А ï> l s(А) или ê Е ï> l s(E)
то произойдет сумма этих событий с вероятностью, не превышающей a.
Критерий.
1. Назначается уровень значимости
2. По найденным ранее значениям А и Е вычисляем s (А) , s (Е) и l.
3. Если не выполняется хотя бы одно из неравенств
ê А ï< l s(А) или ê Е ï< l s(E)
то на уровне значимости a гипотеза нормальности генеральной совокупности
отвергается.
Рассмотренный критерий можно рассматривать как предварительный, предшествующий более основательной проверке гипотезы по методу Пирсона (
)
Задача 2. Проверка гипотезы о нормальном распределении по критерию ![]()
- Нулевая гипотеза Но: Генеральная совокупность имеет нормальное распределение. Т. к. параметры m и s неизвестны, то в качестве:
Правило принятия решения: Если
, то на уровне значимости a нет основания отвергнуть гипотезу Но :
o
- это статистика с числом степеней свободы s = r – l - 1, где r - это число интервалов, а l – число неизвестных параметров (в нашем случае l=2). Как правильно найти число интервалов и вычислить соответствующее выборочное значение поясним далее.
![]() |
Шаг 1: В качестве начальной таблицы возьмем таблицу группированной выборки
№ | интервалы |
|
| n |
|
1 | [-∞; |
|
|
| |
2 | [ |
|
|
| |
3 | [ |
|
|
| |
4 | [ |
|
|
| |
5 | [ |
|
|
| |
6 | [ |
|
|
| |
7 | [ |
|
|
| |
8 | [ |
|
|
| |
|
|
|
|
Шаг 2: Вычисляем теоретические вероятности:
o ![]()
![]()
o 
o 
o ---
o 
o 
Примечание: обратите внимание, что ![]()
Шаг 3: Критерий
использует тот факт, что случайная величина
(i=1,2..k) имеет распределение близкое к нормальному закону N(0;1). Чтобы это утверждение было достаточно точным необходимо, чтобы для всех интервалов выполнялось условие
. Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними интервалами и только потом заполнять последний столбик таблицы.





