7.5. Нормальный закон распределения
Распределение непрерывной случайной величины x называется нормальным, если ее плотность вероятности имеет вид
, (23)
где a=M(x) - математическое ожидание;
- среднее квадратическое отклонение СВ x. Вероятность попадания нормально распределенной СВ x в заданный интервал (a, b) вычисляется по формуле
, (24)
где
- функция Лапласа. Вероятность того, что модуль отклонения случайной величины x от своего математического ожидания меньше любого положительного числа e:
. (25)
Вероятность отклонения относительной частоты w=m/n от постоянной вероятности p появления некоторого события в n независимых испытаниях выражается формулой
, (26)
где q=1-p.
Пример 28. Пусть случайной величиной x является предел текучести данной марки стали, замеренный на некотором количестве проб. Из опыта известно, что величина x распределена нормально с математическим ожиданием a=310МН/м2 и средним квадратическим отклонением s=32 МН/м2. Найти вероятность того, что значение текучести заключено между 290 и 320 МН/м2.
Решение. Для решения этой задачи воспользуемся формулой (24). Вычислим значения
и
. В данной задаче b=320 МН/м2; a=290 МН/м2; a=310 МН/м2; s=32 МН/м2. Тогда
;
. Используя формулу (24), получим: P(290<x<320)=F(0,3125)- F(-0,9375)=
=F(0,3125)+F(0,9375)=0,1217+0,3264=0,4481.
Пример 29. Диаметр втулок, изготовленных на заводе, можно считать нормально распределенной случайной величиной с математическим ожиданием a=25×10-3 м и среднеквадратическим отклонением s=10-4 м. В каких границах будет находиться величина диаметра втулки с вероятностью 0,98?
Решение. Вероятность того, что абсолютная величина отклонения случайной величины x от своего математического ожидания a меньше любого e>0, равна
.
Из этого равенства получим
. По таблице значений функции F(x) находим:
. Отсюда e=2,33×10-4 м. Тогда искомый интервал, в котором будет находиться диаметр втулки с вероятностью 0,98, можно записать: (24,767×10-3; 25,233×10-3 ).
Пример 30. Среди продукции, изготовленной на данном станке, брак составляет 2%. Сколько изделий необходимо взять, чтобы с вероятностью 0,995 можно было ожидать, что относительная частота бракованных изделий среди них отличается от 0,02 по модулю не более чем на 0,005?
Решение. Мы знаем, что если n - число независимых испытаний и p - вероятность появления события в отдельном испытании, то при любом e>0 имеет место равенство (см. формулу (26))
.
В нашем случае p=0,02; q=1-0,02=0.98; P=0,995; e=0,005. Для определения n запишем указанное равенство с учетом данных задачи ![]()
или
.Из таблицы значений функции F(x) находим:
. Отсюда получаем: n=6190 изделий.
8. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗЫ
О НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ
Важнейшим среди законов непрерывных распределений является нормальный закон, плотность и функция распределения которого имеют вид
; где
- функция Лапласа.
Нормальный закон является предельным законом распределения и для ряда других законов распределения. Поэтому основные методы математической статистики разработаны применительно к нормальному закону.
Пусть F(x) - функция распределения изучаемой СВ x. Обозначим через H0 гипотезу о нормальном распределении СВ x.
, где a и s - конкретные значения параметров нормального закона. Эту гипотезу называют нулевой гипотезой. Для ее проверки производят серию из n независимых испытаний. В результате получают выборочную совокупность x1, x2, ..., xn, по которой делают вывод о правильности гипотезы H0. Так как СВ x может принимать бесконечное множество значений, выборочная совокупность содержит неполную информацию о законе распределения СВ x.
По этой причине при оценке гипотезы H0 может быть допущена ошибка. Вероятность ошибочного отклонения правильной нулевой гипотезы называют уровнем значимости. Обычно при проверке гипотезы уровень значимости a берут равным 0,001; 0,01; 0,05. Если уровень значимости взят 0,05, это значит, что примерно в 5% случаев может быть ошибочно отвергнута верная нулевая гипотеза.
Одним из методов статистической проверки гипотезы о законе распределения является критерий согласия c2 (xu-квадрат). Опишем алгоритм проверки с помощью этого критерия гипотезы о нормальном распределении: F(x)=F0(x).
В серии независимых испытаний получаем n значений СВ x. Интервал
, содержащий всю выборочную совокупность, разбиваем точками x1¢, x2¢, ..., xk-1¢ на k частичных интервалов. Статистический закон распределения СВ x записываем в форме таблицы, называемой интервальным статистическим рядом. В верхней строке таблицы выписываются частичные интервалы, в нижней - частоты mi - число значений СВ x, попавших в соответствующий интервал.
Для каждого частичного интервала рассчитываем относительные частоты (частости)
и строим гистограмму и полигон частостей. Исходя из вида гистограммы и полигона, а также механизма образования СВ x, формулируем гипотезу о виде закона распределения. Если полигон по форме напоминает колокол и значения СВ x формируются под действием большого числа случайных факторов, приблизительно равнозначных по своему влиянию на рассеивание значений СВ x, то есть основания (см. центральную предельную теорему) предположить нормальный закон распределения.
Допуская нормальное распределение СВ x, находим точечные оценки его параметров
,
где
- середины частичных интервалов.
Записываем предполагаемый вид функции распределения
.
Вычисляем теоретические частоты npi попадания значений СВ x в i-й частичный интервал, где
. При этом полагаем
;
. Получаем значение случайной величины, называемое c2 - статистикой Пирсона:
,
приближенно имеющей c2 - распределение с n=k-3 степенями свободы. Чем точнее F0(x) воспроизводит закон распределения СВ x, тем ближе теоретические частоты npi к эмпирическим mi и, следовательно, тем меньше
значение c2.
Из таблицы c2 - распределения по выбранному уровню значимости a и числу n=k-3 выбираем значение
, удовлетворяющее условию
.
|
Сравниваем вычисленное значение c2 с табличным. Если c2³
- в единственном испытании (результат испытания - вычисленное значение c2) произошло событие пренебрежимо малой вероятности. Поэтому следует усомниться в исходном предположении , давшем маловероятное событие в единственном испытании. Нулевая гипотеза отклоняется с вероятностью ошибки a. Если c2<
, считается, что нет оснований для отклонения нулевой гипотезы. Гипотетичная функция F0(x) согласуется с опытными значениями СВ x.
Замечание. Число интервалов k и точки деления выбирают так, чтобы все теоретические частоты (кроме, может быть, крайних) удовлетворяли требованию npi³10. Это необходимо для того, чтобы обеспечить близость закона распределения c2 - статистики Пирсона к c2 - распределению. Если указанные неравенства не выполняются, следует либо выбрать новые точки деления, либо объединить некоторые соседние интервалы. При этом не следует брать очень крупные интервалы, чтобы вероятности pi достаточно точно отражали вид предполагаемой функции распределения.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 |


