Интервальное оценивание
Доверительный интервал и вероятность
Оценка параметра распределения является приближенной величиной, поэтому чтобы использовать ее необходимо знать погрешность оценки, то есть границы
и
интервала, в котором находится истинное значение оцениваемого параметра. Поскольку эти границы могут быть определены только на основании случайных результатов опыта, то они также являются случайными величинами. Следовательно, необходимо не только указать интервал
, но и указать надежность этого интервала, то есть вероятность того, что истинное значение параметра будет лежать в данном интервале. Следует заметить, что чем больше уверенность, что параметр принадлежит интервалу, то тем больше интервал. Так что искать интервал, которому принадлежит
с вероятностью 1 бессмысленно - это вся область возможных значений параметра.
Определение. Интервал
, содержащий неизвестный параметр
с заданной вероятностью
, называют доверительным интервалом соответствующим доверительной вероятности
. То есть, если
, то
- доверительный интервал, а
- доверительная вероятность.
Замечание 1. Так как случайными являются границы интервала, а не параметр
, то обычно говорят "интервал
накрывает параметр
", а не "
содержится в интервале
".
Замечание 2. Для дискретных распределений точное равенство
возможно не для всех значений
, в этом случае под доверительным интервалом, соответствующим вероятности
понимается интервал
, удовлетворяющий условию
.
Определение. Интервал
называется асимптотическим доверительным интервалом для параметра
соответствующим доверительной вероятности
, если
.
Число
называют уровнем значимости, оно определяет вероятность того, что доверительный интервал не накроет оцениваемый параметр. Уровень значимости
отделяет события практически невозможные от возможных. Выбор конкретного значения
(или
) зависит от объема выборки и характера решаемой задачи. Обычно
.
Общий принцип построения доверительных интервалов таков:
1) Находим статистику
, зависящую от неизвестного параметра
, закон распределения которой известен (и не зависит от
). Причем необходимо, чтобы статистика
была обратима относительно
.
2) Находим квантили
и
распределения статистики
, такие что
. Заметим, что существует бесконечное множество пар чисел
, для которых
. Обычно в качестве
выбирают квантили распределения статистики
уровней
и
соответственно. Напомним, что квантилем порядка
случайной величины
называется значение
, для которого
. (см. рис.)
3) Разрешив неравенство
относительно
, находим границы доверительного интервала.
Аналогично находится и асимптотический доверительный интервал, с той лишь разницей, что на первом этапе находим статистику
закон распределения которой при
стремится к известному закону, не зависящему от параметра
.
Доверительный интервал для математического ожидания нормальной величины при известном среднеквадратическом отклонении
.
Пусть
выборка, полученная из нормальной генеральной совокупности
с известным среднеквадратичным отклонением
. Требуется построить доверительный интервал для параметра
, соответствующий доверительной вероятности
.
Так как каждая из величин
распределена по закону
, то выборочное среднее
распределено также нормально с параметрами
,
. Тогда
.
Найдем
и
, для которых
. Так как распределение
симметрично, то разумно взять
, где
- квантиль распределения
порядка
(рис). Тогда:
,
или
(3.1)
или
, где ![]()
Замечание 1. Если для нахождения квантилей используется функция Лапласа
, то следует использовать соотношение:
.
Пример. Найти доверительный интервал для математического ожидания нормальной случайной величины
с надежностью
, если
,
,
.
Решение. Имеем
- нормальная случайная величина с известным
. Требуется построить доверительный интервал для математического ожидания этой величины, то есть для параметра
. По таблицам функции Лапласа находим
, для которого
. Следовательно,
. Таким образом, с вероятностью :
или
.
Замечание 2. Если значение
неизвестно, то с помощью статистики
невозможно построить точный доверительный интервал для параметра
нормальной случайной величины. Однако, при больших
величину
можно заменить состоятельной оценкой)
(или
), построив статистику
. Так как
, то
, то есть статистику
можно использовать для построения АДИ для параметра
. Тогда, если
,
- квантили распределения
то:
и искомый интервал имеет вид:
.
Кроме того, поскольку, в соответствии с центральной предельной теоремой, величина
распределена асимптотически нормально для любой случайной величины
, имеющей конечные математическое ожидание и дисперсию, при больших
эту величину можно использовать для построения асимптотических доверительных интервалов для математического ожидания при любом законе распределения величины
. Если же неизвестна величина
, то при больших
ее можно заменить состоятельными оценками
или
.
Замечание 3. Функция
не годится для построения доверительного интервала для
нормальной случайной величины при известном параметре
, а тем более при неизвестном а. Действительно, разрешая неравенство относительно
, мы получим
(при условии
) - бесконечный доверительный интервал.
Асимптотический доверительный интервал для параметра l распределения Пуассона
Пусть
выборка, полученная из генеральной совокупности случайной величины
, распределенной по закону Пуассона
с неизвестным параметром
. Требуется построить доверительный интервал для параметра
, соответствующий доверительной вероятности
.
Рассмотрим статистику
. В соответствии с ЦПТ, при
. Пусть
квантиль распределения
уровня
(
), тогда:
.
Однако, разрешить неравенство относительно
не просто из-за корня в знаменателе. Попробуем заменить в знаменателе
на состоятельную оценку этого параметра
, построив статистику
. Не изменится ли при этом характер сходимости? Вспомним свойство сходимости по распределению: если
а
, то
. Тогда:
, т. к.
.
Следовательно
,
или
.
Таким образом, искомый асимптотический доверительный интервал уровня
имеет вид:
. (3.3)
Асимптотический доверительный интервал для параметра a показательного распределения
Пусть
выборка, полученная из генеральной совокупности случайной величины
, распределенной по показательному закону
с неизвестным параметром
. Требуется построить доверительный интервал для параметра
, соответствующий доверительной вероятности
.
Рассмотрим статистику
. В соответствии с ЦПТ, при
. Пусть
квантиль распределения
уровня
(
), тогда:
,
или
.
Таким образом, искомый асимптотический доверительный интервал уровня
имеет вид:
. (3.3)
Распределения, связанные с нормальным
Поставим задачу: построить точные ДИ для параметров нормального распределения.
Для параметраДля построения подходящих статистик, рассмотрим ряд распределений, связанных с нормальным.
Гамма распределение и его свойства.
Определение. Случайная величина
имеет гамма распределение
, где
,
, если ее плотность распределения имеет вид:
(3.4)
Здесь
- гамма функция.
,
,
.
Найдем характеристическую функцию случайной величины
:

(3.5)
Используя, характеристическую функцию легко найти математическое ожидание и дисперсию гамма-распределения:
,
.
Свойство 1.
есть показательное распределение с параметром
.
Действительно, если
, то
- есть плотность распределения случайной величины, распределенной по показательному закону с параметром
.
Свойство 2. Если
, то
.
Доказательство. Найдем функцию распределения
:

Свойство 3. Если
независимы и
, то
.
Доказательство. По свойству характеристической функции
- что есть характеристическая функция случайной величины, распределенной по
.
Свойство 4. Если
независимы и имеют стандартное нормальное распределение, то
.
Доказательство. Вытекает из свойств 2 и 3.
Распределение "хи-квадрат"
Определение. Распределение суммы квадратов
независимых стандартных нормальных случайных величин называют распределением "хи-квадрат" с
степенями свободы и обозначают
. (Саму случайную величину также часто обозначают
).
Согласно этому определению и свойству 4 предыдущего раздела,
- есть гамма распределение
. Следовательно, плотность распределения
:
, (3.6)
а основные числовые характеристики
,
, мода распределения, при
, равна
.
Графики плотности вероятностей для различных степеней свободы
приведены на рис
Если случайные величины
и
независимы и
,
, то, очевидно, их сумма
.
Распределение Стьюдента
Определение. Пусть
- случайная величина распределенная по закону
, а
- независимая от нее случайная величина распределенная по закону хи-квадрат с
степенями свободы. Тогда распределение величины
(3.7)
называется распределением Стьюдента с
степенями свободы и обозначают
.
Плотность распределения Стьюдента:
,
(3.8)
Числовые характеристики:
,
. Распределение Стьюдента симметрично относительно
.
Так как при
, согласно закону больших чисел,
, то при
.
Преобразования нормальных выборок. Лемма Фишера
Теорема 1 (об ортогональном преобразовании нормального вектора). Пусть
- случайный вектор, координаты которого независимы и имеют стандартное нормальное распределение, а
, где
- ортогональная матрица порядка
(т. е.
),. Тогда координаты
вектора
независимы и имеют стандартное нормальное распределение.
Доказательство. Запишем плотность распределения вектора
. Так как величины
независимы и имеют стандартное нормальное распределение, то:
,
где
.
Чтобы записать плотность распределения вектора
, воспользуемся формулой для плотности при линейном преобразовании вектора: если
, то
. Тогда, с учетом того, что
и
получим:
.
Но, умножение вектора на ортогональную матрицу не меняет нормы вектора, действительно:
.
Следовательно,
, т. е. величины
также как и величины
, независимы и имеют стандартное нормальное распределение.
Теорема 2 (лемма Фишера). Пусть
- выборка из
и
, где
- ортогональная матрица порядка
. Тогда для любого
статистика
распределена по закону
, и не зависит от
.
Доказательство. Так как
, то
(см. доказательство предыдущей теоремы). Тогда
.
Основные следствия леммы Фишера
Пусть
независимы и имеют нормальное распределение
,
,
,
. Тогда:
1.
; (3.9)
2.
; (3.10)
3.
; (3.11)
4.
и
независимы;
5.
. (3.12)
Доказательство.
1. Доказано ранее.
2. Так как величины
, то величина
.
3. Рассмотрим статистику
.
Введем стандартные нормальные величины
и выразим
через
:
, где
. То есть можно изначально считать, что величины
имеют стандартное нормальное распределение. Попробуем применить к
лемму Фишера, для этого представим
в виде:
, где
.
Покажем, что найдется ортогональная матрица
такая, что вектор
, будет иметь координату
. Возьмем в качестве первой строки матрицы
строку,
. Тогда
. Так как норма этой строки (длина вектора) равна 1, то эту строку всегда можно дополнить до ортогональной матрицы (строки и столбы ортогональной матрицы – есть ортонормированные вектора).
Тогда в соответствии с леммой Фишера, статистика
имеет распределение хи-квадрат с
степенью свободы.
4. В соответствии с леммой Фишера, статистика
и
величина
независимы, то есть
и
независимы.
5. Преобразуем
. Величина
, а
величина
, и по следствию 4 эти величины независимы. Следовательно,
.
Точные доверительные интервалы для параметров нормального распределения
1. Для параметра
при известном
.
С вероятностью
:
, где
- квантиль стандартного нормального распределения уровня
.
2. Для параметра
при неизвестном
.
Из следствия 5 леммы Фишера, учитывая симметрию распределения Стьюдента, с вероятностью
получим:
![]()
, (3.13)
где
- квантиль распределения Стьюдента уровня
. Заметим, что квантиль
распределения Стьюдента называется коэффициентом Стьюдента
уровня
.
3. Для параметра
при неизвестном
.
Из следствия 2 леммы Фишера, с вероятностью
получим:
, (3.14)
где
,
- квантили распределения хи-квадрат с
степенями свободы уровней
и
соответственно.
4. Для параметра
при неизвестном
.
Из следствия 3 леммы Фишера, с вероятностью
получим:
, (3.15)
где
,
- квантили распределения хи-квадрат с
степенью свободы уровней
и
соответственно.
Пример 1. Найти доверительный интервал для дисперсии нормальной величины с надежностью
, если
.
Решение. По таблицам распределения
для
степеней свободы находим квантили распределения уровней
и
:
,
. Следовательно, доверительный интервал:
.
Пример 2. Найти доверительный интервал для математического ожидания нормальной случайной величины с надежностью
, если
,
,
.
Решение. По таблицам распределения Стьюдента для
степеней свободы находим коэффициент Стьюдента уровня
:
. Таким образом, с вероятностью
:
или
.


