1) найдутся такие функции
, что
,
2) для любой пары внутренних точек
из области значений
уравнение
имеет единственное решение
, 3)
инвариантна, т. е.
для всех
.
Для семейств со скалярной достаточной статистикой можно просто принять
, так как
. Для двух семейств с минимальной достаточной статистикой ранга два
![]()
поскольку теперь главный фактор критерия факторизации может быть представлен в виде
Будем называть
минимальной эквивариантной компонентой достаточной статистики. Статистику
, если она невырождена, обычно называют дополнительной. Согласно [14], аналог свойства 1) имеет место в весьма общей ситуации, так как
, где
- матрица представления группы
в базисе
.
Теорема 2. Центральная функция
оптимального доверительного интервала в смысле определения 3 имеет вид
, где
- минимальная эквивариантная компонента достаточной статистики, а функция
является единственным решением уравнения
. Пусть
— плотность распределения случайной величины
, тогда функция
может быть найдена по формуле
. Центр оптимального доверительного интервала не зависит от выбора минимальной эквивариантной компоненты и внутренней точки
ее области значений.
Доказательство. Поскольку рассматриваемые семейства экспонентны, условие (3) записывается более конструктивно
(9)
поэтому имеет место хотя бы одна из возможностей: 1) компоненты функции
линейно независимы с константой и тогда все коэффициенты уравнения равны нулю, 2) между указанными функциями существует линейная зависимость
, следствием которой является обращение в нуль подходящих линейных комбинаций компонент вектора
. Первый вариант исключается ввиду того, что из линейной независимости компонент функции
с константой следует
для всех
. Действительно, из условия линейной независимости вытекает уравнение
, где положено
, которое с помощью свойств коэффициентов экспонентного семейства сдвигов [13] преобразуется к виду
при всех
. Так как
при некотором
и
, то
и, следовательно,
. Поскольку вектор производных от
равен нулю, так как
, то сам этот вектор не зависит от
. Пусть теперь компоненты функции
линейно зависимы с константой. Если ранг семейства равен единице, то первая часть теоремы доказана, так как
является решением уравнения
Оставшееся уравнение
(10)
эквивалентноe уравнению
, в котором
обозначает главный фактор критерия факторизации, служит для нахождения функции
. Осталось рассмотреть еще вариант с двумерной достаточной статистикой. Анализ возможностей на основе работы [2] показывает, что направляющими функциями экспонентного семейства, порожденного аддитивными сдвигами, могут быть только функции
, а
. Тогда
не меняется при изменении
,
и
. Поэтому линейная связь между статистиками
имеет вид:
Благодаря этому
выписывается в явном виде и является единственным решением уравнения
, коэффициенты которого
, находятся из свойства эквивариантности
. Одновременно уравнение (9) преобразуется к виду
. Доказательство оставшейся части теоремы опирается на два вспомогательных утверждения. Пусть
— главный фактор критерия факторизации для какой-либо достаточной статистики
. Обозначим через
множество тех значений минимальной эквивариантной компоненты, для которых
в случае
или
в двумерном случае. Легко видеть, что
не зависит от значений
и статистики
.
Лемма 2. В принятых обозначениях при
плотность распределения достаточной статистики
относительно меры Лебега в
имеет вид
(11)
где
- неотрицательная функция.
Если
, то ее плотность распределения относительно меры Лебега в
определяется формулой
![]()
где
— нормирующая постоянная. Обе формулы допускают обобщение на семейства, порожденные сдвигами группы Ли, одно из них можно найти в работе [12]. Из этой последней формулы следует, что для семейств со скалярной достаточной статистикой уравнение
эквиалентно подобному уравнению для
, из которого следует уравнение (10). Для двумерной достаточной статистики уравнение
эквивалентно аналогичному уравнению для
в силу формулы (11), из которого следует уравнение
, с другой стороны, интегрируя начальное уравнение по переменной
, получим ![]()
Независимость центров оптимальных доверительных интервалов от выбора достаточной статистики и точки
или
следует из приведенной ниже леммы 3. Отразим в обозначениях функций
и
их зависимость от вида статистики и внутренней точки пространства значений. Для этого решение уравнения
будем обозначать
, а решение уравнения
– через
.
Лемма 3. Для любой эквивариантной статистики
с однородной областью значений
.
Всякие две эквивариантные статистики
с однородными пространствами значений эквивалентны. При этом, если
, то 
Случай, когда
, т. е. когда оптимальный доверительный интервал имеет вид
исследовался и ранее. В частности, в работе [17] показано, что для параметра положения
имеет вид
(12)
Эта оценка называется оценкой Питмена для параметра положения. В работе [17] рассмотрены доверительные интервалы и для параметра масштаба, причем показано, что оптимальный доверительный интервал имеет либо несобственная функция распределения, либо функция Гамма - распределения, при этом
(13)
Результат же данной работы является естественным обобщением этих случаев и приводит к характеризации более широкого класса семейств.
Примеры построения оптимальных доверительных интервалов постоянной длины
Проиллюстрируем теоретические положения на примерах. Для этого согласно теореме 2 для построения оптимального доверительного интервала (в смысле определения 3) необходимо:
1) Найти достаточную статистику семейства и главный фактор критерия факторизации, согласно определения 4,
2) Найти плотность распределения достаточной статистики (6) и определить центральную функцию
оптимального доверительного интервала,
3) Найти плотность распределения
минимальной эквивариантной компоненты достаточной статистики,
4) Решить уравнение:
и определить величину
,
5) Выписать доверительный интервал.
Пример 1. Нормальное семейство. Порождающая плотность семейства имеет вид
![]()
Так как главный фактор критерия факторизации
, то достаточная статистика
и
. Матрица преобразования
теперь равна
так что уравнение (5) имеет вид
следовательно центральной статистикой будет
поэтому, если взять
то
Тогда формула (6) теоремы из [13] дает следующее выражение для плотности распределения достаточной статистики
:

Далее применим результаты теоремы 2. Тогда мы получим следующее уравнение:

где
Тогда получим следующий результат
при условии ![]()
И теперь выпишем величину
так как центр доверительного интервала не зависит от
то можно положить
Тогда оптимальный доверительный интервал имеет вид:
![]()
Пример 2. Гипернормальное распределение. Порождающая плотностью семейства
![]()
Для этого семейства
с
, и
. Матрица
теперь равна
, а уравнение (5) имеет вид
, следовательно центральная статистика имеет вид
И следовательно, если подобрать
, то 
Применяя теорему , получим плотность распределения достаточной статистики
![]()
Результат теоремы 2 перепишется в следующем виде
![]()

Или же ![]()
Так как
тогда получим
Поскольку как центр доверительного интервала не зависит от
то можно положить
поэтому
![]()
Пример 3. Рспределение Клебанова - Рухина. Порождающая плотность семейства

Так как распределение Клабанова - Рухина является семейством с двумерной достаточной статистикой, то главный фактор критерия факторизации
Достаточная статистика
и
. Далее,
так что решением уравнения (4) является
или при
можно записать ![]()
Плотность распределения
равна
![]()
где
- некоторая функция, зависящая от
. Далее применим результаты теоремы 2, получим:
![]()
Поскольку
тогда получим 
Очевидно, что
в данном случае будет иметь вид:
![]()
C помощью замены переменной
семейство с параметром положения
преобразуется в семейство с параметром масштаба
. Поэтому, если пара
определяет доверительный интервал максимальной вероятности при фиксированной длине
для параметра положения
совокупности
, то пара
определяет доверительный интервал максимальной вероятности при фиксированном отношении концов
для параметра масштаба
совокупности
(здесь
- векторная статистика, компонентами которой служат
). Это замечание позволяет ограничиться только исследованием семейств с аддитивным параметром сдвига. В частности, оптимальный доверительный интервал
при заданном
для параметра масштаба
в предположении, что плотность распределения
непрерывно дифференцируема и положительна при всех
, существует при любом
только для трех типов семейств - логнормального, Гамма - распределения и распределения Клебанова - Рухина, зависящего от параметра масштаба:

Проиллюстрируем эти положения на примерах.
Пример 4. Логнормальное семейство. Порождающая плотностью

Главный фактор критерия факторизации
Достаточная статистика
и
. Матрица
теперь равна
так что уравнение (4) имеет вид
, тогда центральная достаточная статистика
или при
можно записать 
Плотность распределения достаточной статистики
равна
![]()
Применим результат теоремы 2, получим:

где
Поскольку
то очевидно, что ![]()
Пример 5. Обобщенное Гамма - распределение. Порождающая плотность семейства
![]()
Главный фактор критерия факторизации
, достаточная статистика
с областью значений
. Матрица представления мультипликативной группы в базисе
равна
так что уравнение перепишется в виде
тогда центральная статистика
и при
можно записать

Плотность распределения достаточной статистики
![]()
Далее применим результаты теоремы 2, получим:


Или же это выражение перепишется в виде

подставляя
получим

Пример 6. Рспределение Клебанова – Рухина.
Порождающая плотность распределения имеет вид
![]()
Главный фактор критерия факторизации
Достаточная статистика
и
. Матрица
теперь равна
так что уравнение (4) имеет вид
, тогда центральная достаточная статистика
или при
можно записать 
Плотность распределения достаточной статистики
равна
![]()
где
- некоторая функция, зависящая от
.
Применим результаты теоремы 2, получим:
![]()
![]()
Или же перепишем в виде:
![]()
Подставляя в это уравнение
получим

Указанные параметры порождающих плотностей предполагаются известными.
Иллюстрация теоретических построений оформлена в виде двух таблиц 1 и 2 из [11]. В таблице 1 указаны основные фрагменты построения оптимальных доверительных интервалов, в таблицу 2 - сводка финальных результатов.
Таблица 1
Параметры распределений
Тип | Главный фактор | Эквивариантные |
|
семейства | критерия факторизации | достаточные статистики |
|
|
|
|
|
HN(a) |
|
|
|
LGN(b) |
|
|
|
GAM(b) |
|
|
|
KR(a) |
|
|
|
KR(b) |
|
|
|
Аббревиатура HN(a) принята для обозначения семейства, порожденного аддитивными сдвигами плотности
и называемого гипернормальным [7], GAM(b) - для обобщенного гамма семейства [19], порожденного сдвигами плотности
, и KR - для семейств с достаточной статистикой ранга два. Последнее из сокращений включает начальные буквы фамилий авторов работы [9], прочие сокращения очевидны. В таблице 2 приведены функции
, плотности распределения достаточных статистик
для скалярного случая, вид плотностей статистик
для распределений KR, а также соответствующие функции
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 |


