1) найдутся такие функции , что ,

2) для любой пары внутренних точек из области значений уравнение имеет единственное решение , 3) инвариантна, т. е. для всех .

Для семейств со скалярной достаточной статистикой можно просто принять , так как . Для двух семейств с минимальной достаточной статистикой ранга два

поскольку теперь главный фактор критерия факторизации может быть представлен в виде Будем называть минимальной эквивариантной компонентой достаточной статистики. Статистику , если она невырождена, обычно называют дополнительной. Согласно [14], аналог свойства 1) имеет место в весьма общей ситуации, так как , где - матрица представления группы в базисе .

Теорема 2. Центральная функция оптимального доверительного интервала в смысле определения 3 имеет вид , где - минимальная эквивариантная компонента достаточной статистики, а функция является единственным решением уравнения . Пусть — плотность распределения случайной величины , тогда функция может быть найдена по формуле . Центр оптимального доверительного интервала не зависит от выбора минимальной эквивариантной компоненты и внутренней точки ее области значений.

Доказательство. Поскольку рассматриваемые семейства экспонентны, условие (3) записывается более конструктивно

(9)

поэтому имеет место хотя бы одна из возможностей: 1) компоненты функции линейно независимы с константой и тогда все коэффициенты уравнения равны нулю, 2) между указанными функциями существует линейная зависимость , следствием которой является обращение в нуль подходящих линейных комбинаций компонент вектора . Первый вариант исключается ввиду того, что из линейной независимости компонент функции с константой следует для всех . Действительно, из условия линейной независимости вытекает уравнение , где положено , которое с помощью свойств коэффициентов экспонентного семейства сдвигов [13] преобразуется к виду при всех . Так как при некотором и , то и, следовательно, . Поскольку вектор производных от равен нулю, так как , то сам этот вектор не зависит от . Пусть теперь компоненты функции линейно зависимы с константой. Если ранг семейства равен единице, то первая часть теоремы доказана, так как является решением уравнения Оставшееся уравнение

(10)

эквивалентноe уравнению , в котором обозначает главный фактор критерия факторизации, служит для нахождения функции . Осталось рассмотреть еще вариант с двумерной достаточной статистикой. Анализ возможностей на основе работы [2] показывает, что направляющими функциями экспонентного семейства, порожденного аддитивными сдвигами, могут быть только функции , а . Тогда не меняется при изменении , и . Поэтому линейная связь между статистиками имеет вид: Благодаря этому выписывается в явном виде и является единственным решением уравнения , коэффициенты которого , находятся из свойства эквивариантности . Одновременно уравнение (9) преобразуется к виду . Доказательство оставшейся части теоремы опирается на два вспомогательных утверждения. Пусть — главный фактор критерия факторизации для какой-либо достаточной статистики . Обозначим через множество тех значений минимальной эквивариантной компоненты, для которых в случае или в двумерном случае. Легко видеть, что не зависит от значений и статистики .

НЕ нашли? Не то? Что вы ищете?

Лемма 2. В принятых обозначениях при плотность распределения достаточной статистики относительно меры Лебега в имеет вид

(11)

где - неотрицательная функция.

Если , то ее плотность распределения относительно меры Лебега в определяется формулой

где — нормирующая постоянная. Обе формулы допускают обобщение на семейства, порожденные сдвигами группы Ли, одно из них можно найти в работе [12]. Из этой последней формулы следует, что для семейств со скалярной достаточной статистикой уравнение эквиалентно подобному уравнению для , из которого следует уравнение (10). Для двумерной достаточной статистики уравнение эквивалентно аналогичному уравнению для в силу формулы (11), из которого следует уравнение , с другой стороны, интегрируя начальное уравнение по переменной , получим

Независимость центров оптимальных доверительных интервалов от выбора достаточной статистики и точки или следует из приведенной ниже леммы 3. Отразим в обозначениях функций и их зависимость от вида статистики и внутренней точки пространства значений. Для этого решение уравнения будем обозначать , а решение уравнения – через .

Лемма 3. Для любой эквивариантной статистики с однородной областью значений .

Всякие две эквивариантные статистики с однородными пространствами значений эквивалентны. При этом, если , то

Случай, когда , т. е. когда оптимальный доверительный интервал имеет вид исследовался и ранее. В частности, в работе [17] показано, что для параметра положения имеет вид

(12)

Эта оценка называется оценкой Питмена для параметра положения. В работе [17] рассмотрены доверительные интервалы и для параметра масштаба, причем показано, что оптимальный доверительный интервал имеет либо несобственная функция распределения, либо функция Гамма - распределения, при этом

(13)

Результат же данной работы является естественным обобщением этих случаев и приводит к характеризации более широкого класса семейств.

Примеры построения оптимальных доверительных интервалов постоянной длины

Проиллюстрируем теоретические положения на примерах. Для этого согласно теореме 2 для построения оптимального доверительного интервала (в смысле определения 3) необходимо:

1) Найти достаточную статистику семейства и главный фактор критерия факторизации, согласно определения 4,

2) Найти плотность распределения достаточной статистики (6) и определить центральную функцию оптимального доверительного интервала,

3) Найти плотность распределения минимальной эквивариантной компоненты достаточной статистики,

4) Решить уравнение: и определить величину ,

5) Выписать доверительный интервал.

Пример 1. Нормальное семейство. Порождающая плотность семейства имеет вид

Так как главный фактор критерия факторизации , то достаточная статистика и . Матрица преобразования теперь равна так что уравнение (5) имеет вид следовательно центральной статистикой будет поэтому, если взять то Тогда формула (6) теоремы из [13] дает следующее выражение для плотности распределения достаточной статистики :

Далее применим результаты теоремы 2. Тогда мы получим следующее уравнение:

где Тогда получим следующий результат при условии

И теперь выпишем величину так как центр доверительного интервала не зависит от то можно положить Тогда оптимальный доверительный интервал имеет вид:

Пример 2. Гипернормальное распределение. Порождающая плотностью семейства

Для этого семейства с , и . Матрица теперь равна , а уравнение (5) имеет вид , следовательно центральная статистика имеет вид И следовательно, если подобрать , то

Применяя теорему , получим плотность распределения достаточной статистики

Результат теоремы 2 перепишется в следующем виде

Или же

Так как тогда получим Поскольку как центр доверительного интервала не зависит от то можно положить поэтому

Пример 3. Рспределение Клебанова - Рухина. Порождающая плотность семейства

Так как распределение Клабанова - Рухина является семейством с двумерной достаточной статистикой, то главный фактор критерия факторизации Достаточная статистика и . Далее, так что решением уравнения (4) является или при можно записать

Плотность распределения равна

где - некоторая функция, зависящая от . Далее применим результаты теоремы 2, получим:

Поскольку тогда получим

Очевидно, что в данном случае будет иметь вид:

C помощью замены переменной семейство с параметром положения преобразуется в семейство с параметром масштаба . Поэтому, если пара определяет доверительный интервал максимальной вероятности при фиксированной длине для параметра положения совокупности , то пара определяет доверительный интервал максимальной вероятности при фиксированном отношении концов для параметра масштаба совокупности (здесь - векторная статистика, компонентами которой служат ). Это замечание позволяет ограничиться только исследованием семейств с аддитивным параметром сдвига. В частности, оптимальный доверительный интервал при заданном для параметра масштаба в предположении, что плотность распределения непрерывно дифференцируема и положительна при всех , существует при любом только для трех типов семейств - логнормального, Гамма - распределения и распределения Клебанова - Рухина, зависящего от параметра масштаба:

Проиллюстрируем эти положения на примерах.

Пример 4. Логнормальное семейство. Порождающая плотностью

Главный фактор критерия факторизации Достаточная статистика и . Матрица теперь равна так что уравнение (4) имеет вид , тогда центральная достаточная статистика или при можно записать

Плотность распределения достаточной статистики равна

Применим результат теоремы 2, получим:

где Поскольку то очевидно, что

Пример 5. Обобщенное Гамма - распределение. Порождающая плотность семейства

Главный фактор критерия факторизации , достаточная статистика с областью значений . Матрица представления мультипликативной группы в базисе равна так что уравнение перепишется в виде тогда центральная статистика и при можно записать

Плотность распределения достаточной статистики

Далее применим результаты теоремы 2, получим:

Или же это выражение перепишется в виде

подставляя получим

Пример 6. Рспределение Клебанова – Рухина.

Порождающая плотность распределения имеет вид

Главный фактор критерия факторизации Достаточная статистика и . Матрица теперь равна так что уравнение (4) имеет вид , тогда центральная достаточная статистика или при можно записать

Плотность распределения достаточной статистики равна

где - некоторая функция, зависящая от .

Применим результаты теоремы 2, получим:

Или же перепишем в виде:

Подставляя в это уравнение получим

Указанные параметры порождающих плотностей предполагаются известными.

Иллюстрация теоретических построений оформлена в виде двух таблиц 1 и 2 из [11]. В таблице 1 указаны основные фрагменты построения оптимальных доверительных интервалов, в таблицу 2 - сводка финальных результатов.

Таблица 1

Параметры распределений

Тип

Главный фактор

Эквивариантные

семейства

критерия факторизации

достаточные статистики

HN(a)

LGN(b)

GAM(b)

KR(a)

KR(b)

Аббревиатура HN(a) принята для обозначения семейства, порожденного аддитивными сдвигами плотности и называемого гипернормальным [7], GAM(b) - для обобщенного гамма семейства [19], порожденного сдвигами плотности , и KR - для семейств с достаточной статистикой ранга два. Последнее из сокращений включает начальные буквы фамилий авторов работы [9], прочие сокращения очевидны. В таблице 2 приведены функции , плотности распределения достаточных статистик для скалярного случая, вид плотностей статистик для распределений KR, а также соответствующие функции .

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3