Для построения доверительного интервала при объеме выборки n
обычно используется статистика
, имеющая распределение Пирсона с ν=n-1.
Выбирая уровень доверительной вероятности γ можно записать
Р{
}=1- α (9.26)
Далее по таблице
- распределения можно выбрать такие два значения
и
, чтобы площадь, заключенная под дифференциальной функцией распределения
между
и
, была равна γ=1- α.
Обычно ![]()
и
выбирают так, чтобы Р(
<
)=Р(
>
)=
, (9.27)
Проведя соответствующие преобразования и учитывая то, что таблица
-распределения содержит значения только для Р(
>
), окончательно получаем:
![]()
![]()
, (9.28)
причем Р(
)=Р(
>
)=1-
; (9.29)
Р(
)=Р(
>
)=
.
Доверительный интервал для генерального среднего квадратического отклонения равен ![]()
![]()
. (9.30)
При достаточно больших объемах выборки (n>30) доверительный интервал для генерального среднего квадратического отклонения определяется по формуле:

![]()
![]()

. (9.31)
Интервальная оценка для генеральной доли
При достаточно больших n (n
) можно считать, что частость ω=
имеет приближенно нормальное распределение с параметрами N(р;
). В этом случае доверительный интервал для генеральной доли р определяется соотношением
-
![]()
![]()
+
, (9.32)
где
определяется по таблице интегральной функции Лапласа Ф(t),
- частость события А;
(1-
) - частость противоположного события А.
Точность оценки равна
=
. (9.33)
10 Предварительный анализ данных
Статистической называют гипотезу (предположение) о виде неизвестного распределения или о параметрах известных распределений.
Нулевой (основной) называют выдвинутую гипотезу Н0, которую необходимо проверить. Конкурирующей (альтернативной) гипотезой Н1 называют гипотезу, противоположную нулевой гипотезе.
Если проверяемое утверждение сводится к гипотезе о том, что значение некоторого параметра θ в точности равно заданной величине θ0, то это гипотеза называется простой, в других случаях гипотеза будет называться сложной.
Статистическим критерием называют случайную величину , которая служит для проверки гипотезы. Статистический критерий однозначно определяет правило, устанавливающее условия, при которых выдвинутую гипотезу Н0 следует либо отвергнуть, либо принять.
Наблюдаемым (эмпирическим) значением называют то значение критерия, которое вычислено по выборке.
Критической областью (W) называют совокупность значений критерия, при которых нулевую гипотезу Н0 отвергают. Областью принятия гипотезы (областью допустимых значений, Q) называют совокупность значения критерия, при которых нулевую гипотезу Н0 принимают. Критическими точками (границами) qкр называют точки, отделяющие критическую область от области принятия гипотезы.
В зависимости от содержания конкурирующей гипотезы Н1 выбирают правостороннюю, левостороннюю или двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством > qкр , где qкр - положительное число. Левосторонней называют критическую область, определяемую неравенством < qкр , где qкр - отрицательное число. Двусторонней называют критическую область, определяемую неравенствами < q1 и > q2 , где q2 > q1 .
В частности, если критические точки симметричны относительно нуля, то двустороння критическая область определяется неравенствами (в предположении, что qкр>0): <- qкр, > qкр, или равносильным неравенством
> qкр.
Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значения критерия принадлежит области принятия гипотез, то гипотезу принимают. При использовании этого принципа возможны четыре случая:
- гипотеза Н0 верна и ее принимают согласно критерию;
- гипотеза Н0 неверна и ее отвергают согласно критерию;
- гипотеза Н0 верна но ее отвергают согласно критерию, т. е. допускается ошибка, которую принято называть ошибкой первого рода.
- гипотеза Н0 неверна и ее принимают согласно критерию, т. е. допускается ошибка второго рода.
Уровнем значимости α = 1-γ называют вероятность совершить ошибку первого рода. С уменьшением α возрастает вероятность ошибки второго рода β.
Мощностью критерия (1- β) называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза Н0 будет отвергнута, если верна конкурирующая гипотеза.
Пусть Р(![]()
W/Н) – вероятность попадания статистики критерия
в критическую область W, если верна соответствующая гипотеза Н.
Тогда требования к критической области можно записать следующим образом:
(10.1)
Из условия (3.1) следует, что критическую область нужно выбирать так, чтобы вероятность попадания в нее была бы минимальной (равной α), если верна нулевая гипотеза и максимальной в противоположном случае.
Границы критической области при заданном уровне α находят из соотношений:
при правосторонней критической области: Р(
>qкр) = α; (10.2)
при левосторонней критической области: Р(
<qкр) = α; (10.3)
при двусторонней критической области: Р(
>qкр. пр) =
;
Р(
<qкр. лев) =
. (10.4)
Общая логическая схема статистического критерия.
1. Выдвигается гипотеза Н0.
2. Задается величина уровня значимости критерия α. К стандартным значениям можно отнести величины α =0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Особенно распространенной является величина уровня значимости α, равная 0,05. Она означает, что в среднем, в пяти случаях из ста выдвинутая гипотеза будет ошибочно отвергнута.
3. Задаются некоторым статистическим критерием, который в предположении справедливости выдвинутой гипотезы Н0 подчинен некоторому хорошо изученному (табулированному) закону распределения. Статистический критерий служит мерой расхождения имеющихся в распоряжении выборочных данных с проверяемой гипотезой Н0.
4. В зависимости от вида критической области (двусторонняя или односторонняя) по таблице плотности распределения статистического критерия находят 100(1-
)% - ные точки распределения для двусторонней области или 100(1- α)% - ную точку распределения для односторонней области. Указанные токи разделяют всю область мыслимых значений на три части: область неправдоподобно малых, область неправдоподобно больших и правдоподобных значений. В терминах данных выше определений области неправдоподобно больших и неправдоподобно малых значений составляют критическую область. Область правдоподобных значений составляет область принятия гипотезы.
5. По имеющимся выборочным данным подсчитывают численное значение статистического критерия. Если вычисленное значение критерия принадлежит области правдоподобных значений (области принятия гипотезы), гипотеза Н0 считается не противоречащей выборочным данным.
К основным типам гипотез, проверяемых в ходе статистической обработки данных можно отнести следующие: гипотезы о числовых значениях параметров исследуемой генеральной совокупности; гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей; гипотезы о типе закона распределения исследуемой случайной величины.
Проверка гипотезы о значении генеральной средней
Дисперсия генеральной совокупности известна.
Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: μ= μ0 о равенстве генеральной средней μ гипотетическому значению μ0 при конкурирующей гипотезе Н1: μ
μ0 , надо вычислить наблюдаемое значение критерия tн =
(10.5)
и по таблице функции Лапласа найти критическую точку tкр двусторонней критической области из равенства Ф(tкр) = 1-α. (10.6)
Если
< tкр – нет оснований отвергнуть нулевую гипотезу. Если
> tкр – нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе Н1: μ> μ0 критическую точку правосторонней области находят из равенства Ф(tкр) = 1-2α. (10.7)
Если tн < tкр – нет оснований отвергнуть нулевую гипотезу, если tн> tкр – нулевую гипотезу отвергают.
Правило 3. При конкурирующей гипотезе Н1: μ< μ0 сначала находят вспомогательную критическую точку tкр по правилу 2, а затем полагают границу левосторонней критической области
= - tкр. Если tн > - tкр – нет оснований отвергнуть нулевую гипотезу, если tн<- tкр – нулевую гипотезу отвергают.
Дисперсия генеральной совокупности неизвестна. В качестве критерия проверки нулевой гипотезы Н0: μ= μ0 используют выборочную характеристику
tн =
. (10.8)
Величина tн имеет распределение Стьюдента с ν=n-1 степенями свободы.
Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу о равенстве генеральной средней μ гипотетическому значению μ0 при конкурирующей гипотезе Н1: μ
μ0, надо вычислить наблюдаемое значение критерия и по таблице распределения Стьюдента найти критическую точку tкр(α; ν), исходя из условия St(tкр; ν)=Р(
>tкр)= α. (10.9)
Если
< tкр(α; ν) – нет оснований отвергнуть нулевую гипотезу. Если
> tкр(α; ν) – нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе Н1: μ> μ0 критическую точку правосторонней области находят из равенства St(tкр; ν)=Р(
>tкр)= 2α. (10.10)
Если tн < tкр(2α; ν) – нет оснований отвергнуть нулевую гипотезу. Если tн > tкр(2α; ν) – нулевую гипотезу отвергают.
Правило 3. При конкурирующей Н1: μ< μ0 сначала находят вспомогательную критическую точку tкр по правилу 2, а затем полагают границу левосторонней критической области
= - tкр. Если tн >- tкр(2α; ν) - нет оснований отвергнуть нулевую гипотезу, если tн<- tкр(2α; ν) – нулевую гипотезу отвергают.
Проверка гипотезы о значении дисперсии генеральной совокупности
В качестве критерия проверки нулевой гипотезы Н0: σ2= σ02 принимают случайную величину
, (10.11)
которая имеет
распределение с ν=n-1 степенями свободы.
Правило 1. Если Н1: , то строят двустороннюю критическую область. Левую (
) и правую (
) границы критической области находят из условий:
Р(χ2>
(1-
; ν))=1-
, (10.12)
Р(χ2>
(1-
; ν))=
.
В этом случае правило проверки гипотезы сводится к следующему: если ![]()
![]()
![]()
, то у нас нет основания отвергнуть гипотезу. Если же
<
или
>
, то гипотезу отвергают.
Правило 2. Если Н1: , то строят правостороннюю критическую область и
находят из условия: Р(χ2>
(α; ν))= α. (10.13)
Если
>
, то нулевую гипотезу отвергают, если же
<
, то нулевая гипотеза не противоречит опытным данным.
Правило 3. Если Н1: , то строят левостороннюю критическую область и
находят из условия: Р(χ2>
(1-α; ν))= 1-α. (10.14)
Если
<
, то нулевую гипотезу отвергают, если же ![]()
![]()
, то нулевая гипотеза не отвергается.
Сравнение наблюдаемой относительной частоты с гипотетической
вероятностью появления события
Пусть по достаточно большому числу n независимых испытаний, в каждом из которых вероятность р появления события А постоянна, но неизвестна, найдена относительная частота
. Требуется при заданном уровне значимости α проверить нулевую гипотезу Н0: р= р0.
Для проверки нулевой гипотезы используется статистика
tн =
, (10.15)
при больших n (n>0), имеющей приближенно нормальное распределение.
Правило 1. При конкурирующей гипотезе Н1: р
р0 критическую точку tкр двусторонней критической области находят из условия: Ф(tкр)= 1- α. (10.16)
Если
< tкр – нет оснований отвергнуть нулевую гипотезу, если
> tкр - нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе Н1: р>р0 критическую точку tкр правосторонней критической области находят из условия: Ф(tкр)= 1- 2α. (10.17)
Если tн < tкр – нет оснований отвергнуть нулевую гипотезу, если tн > tкр - нулевую гипотезу отвергают.
Правило 3. При конкурирующей гипотезе Н1: р<р0 находят критическую точку tкр по правилу 2, затем полагают границу левосторонней критической области
= - tкр. Если tн >- tкр – нет оснований отвергнуть нулевую гипотезу, если tн <- tкр - нулевую гипотезу отвергают.
При использовании вышеприведенных правил следует иметь ввиду, что удовлетворительные результаты обеспечивает выполнение неравенства np0q0 >9.
Сравнение двух средних нормальных генеральных совокупностей
Дисперсии генеральных совокупностей известны. Пусть X и Y - нормальные генеральные совокупности с известными дисперсиями
и
и неизвестными математическими ожиданиями μх и μу.
Из генеральных совокупностей взяты две независимые выборки объемом nх и nу. Пусть
- средние арифметические выборочных совокупностей. Требуется проверить нулевую гипотезу Н0: μх= μу на уровне значимости α.
Для проверки нулевой гипотезы используется следующая статистика:
tн =
, (10.17)
имеющая нормальное нормированное распределение с параметрами N(0;1)
Правило 1. При конкурирующей гипотезе Н1: μх μу критическую точку tкр двусторонней критической области находят из условия: Ф(tкр)=1- α. (10.18)
Если
< tкр – нет оснований отвергнуть нулевую гипотезу, если
> tкр - нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе Н1: μх > μу критическую точку tкр правосторонней критической области находят из условия: Ф(tкр)=1- 2α. (10.19)
Если tн < tкр – нет оснований отвергнуть нулевую гипотезу, если tн > tкр - нулевую гипотезу отвергают.
Правило 3. При конкурирующей гипотезе Н1: μх < μу находят критическую точку tкр по правилу 2, затем полагают границу левосторонней критической области
= - tкр. Если tн >- tкр – нет оснований отвергнуть нулевую гипотезу, если tн <- tкр - нулевую гипотезу отвергают.
Дисперсии генеральных совокупностей неизвестны. Для проверки нулевой гипотезы Н0: μх= μу на уровне значимости α используют статистику:
tн = 
, (10.20)
имеющую распределение Стьюдента с числом степеней свободы ν= nх+ nу –2.
Правило 1. При конкурирующей гипотезе Н1: μх μу критическую точку tкр(α;ν) двусторонней критической области находят из условия:
St(tкр; ν)=Р(
>tкр)= α (10.21)
Если
< tкр(α; ν) – нет оснований отвергнуть нулевую гипотезу. Если
> tкр(α; ν) – нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе Н1: μх > μу критическую точку правосторонней области находят из равенства St(tкр; ν)=Р(
>tкр)= 2α. (3.22)
Если tн < tкр(2α; ν) – нет оснований отвергнуть нулевую гипотезу. Если tн > tкр(2α; ν) – нулевую гипотезу отвергают.
Правило 3. При конкурирующей гипотезе Н1: μх < μу сначала находят вспомогательную критическую точку tкр по правилу 2, а затем полагают границу левосторонней критической области
= - tкр. Если tн > - tкр(2α; ν) - нет оснований отвергнуть нулевую гипотезу, если tн< - tкр(2α; ν) – нулевую гипотезу отвергают.
Проверка гипотезы о равенстве генеральных дисперсий двух нормальных совокупностей
Пусть X и Y генеральные совокупности, значения признаков которых распределены по нормальному закону с дисперсиями
и
. Из этих совокупностей взяты независимые случайные выборки объемом nх и nу , и пусть
и
, причем
>
. Требуется на заданном уровне значимости α проверить нулевую гипотезу Н0:
=
. Для проверки нулевой гипотезы используется статистика
Fн =
, (10.23)
подчиняющаяся распределению Фишера-Снедекора (F-распределение) с ν1=nх–1 и ν2= nу –1.
Правило 1. При конкурирующей гипотезе Н1:
критическую точку Fкр двусторонней критической области находят из условия:
P (F> Fкр(α/2; ν1; ν2))= α/2. (10.24)
Если Fн < Fкр - нет оснований отвергнуть нулевую гипотезу, если Fн > Fкр - нулевую гипотезу отвергают.
Правило 2. При конкурирующей гипотезе Н1:
>
критическую точку Fкр двусторонней критической области находят из условия:
P (F> Fкр(α; ν1; ν2))= α. (10.25)
Если Fн < Fкр - нет оснований отвергнуть нулевую гипотезу, если Fн > Fкр - нулевую гипотезу отвергают.
Проверка гипотезы об однородности ряда дисперсий.
При сравнении более двух генеральных дисперсий применяют два наиболее часто употребляемых критерия: критерий Бартлета и критерий Кохрана.
Критерий Бартлета. Пусть генеральные совокупности Х1, Х2,…,Хl распределены нормально. Из этих совокупностей извлечены независимые выборки различных объемов ni . По выборкам найдены исправленные дисперсии
,
,…,
. Требуется на уровне значимости α проверить нулевую гипотезу:
Н0:
=
=….=
.
В качестве выборочной характеристики используется статистика, предложенная Бартлетом:
=
, (10.26)
При
>3 величина
приближенно имеет
распределение с ν= l-1 степенями свободы, где l - число выборок;
-исправленная выборочная дисперсия i – ой выборки;
=
- среднее значение исправленной дисперсии по всем l выборкам.
Правило. Для проверки нулевой гипотезы строят правостороннюю критическую область, границы которой
находят по таблице
распределения из условия: P (
>
(α; ν=l-1)= α. (10.27)
Если
<
- нет оснований отвергнуть нулевую гипотезу, если
>
- нулевую гипотезу отвергают.
Критерий Кохрана. Данный критерий применяется для проверки на уровне значимости α нулевой гипотезы Н0:
=
=….=
по выборкам разных объемов ni. В качестве выборочной характеристики используется статистика, предложенная Кохраном: G=
, (10.28)
имеющая G – распределение с числом степеней свободы ν1= n –1 и ν2= l, где l – число сравниваемых совокупностей.
Для проверки нулевой гипотезы строят правостороннюю критическую область, границу которой Gкр определяют по таблице G – распределения, исходя из условия:
P (Gн > Gкр (α; ν))= α. (10.29)
Если Gн < Gкр - то нулевая гипотеза не отвергается.
Гипотеза об однородности рада вероятностей
Пусть Х1, Х2,…,Хl - l генеральных совокупностей, каждая из которых характеризуется неизвестным параметром Рi, где Рi - вероятность появления события А в соответствующей выборке. Требуется на уровне значимости α проверить нулевую гипотезу Н0: р1= p2 =… = pl.
Для проверки гипотезы используется статистика
= 
, (10.30)
которая имеет асимптотическое
распределение с ν= l-1 степенями свободы, l - число выборок;
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |


