2.2. Использование принципов игрового подхода

в задачах идентификации

2.2.1. Априорная информация о помехах

и классах распределений

Опыт практического применения оптимальных методов оценивания показывает, что они весьма чувствительны к обычно имеющимся на практике нарушениям условий их оптимальности и вследствие этого оказываются малоэффективными. Задачей теории робастности является разработка таких статистических процедур, которые лишь незначительно уступают в эффективности классическим оптимальным процедурам при точном выполнении условий их оптимальности и сохраняют высокую эффективность при нарушении этих условий.

Термин «робастный» (bust — сильный, крепкий) в указанном выше смысле был введен в употребление Боксом в 1953 г. Методы, разработанные теорией робастности, имеют важное практическое значение для повышения эффективности статистических процедур при решении задач идентификации, фильтрации, обнаружения, распознавания образов и других.

Особые трудности при реализации классических оптимальных методов связаны с предположением о том, какому закону распределения подчиняются случайные помехи. Как правило, плотность распределения помех полностью неизвестна. Однако могут быть известны какие-либо сведения о , которые определяют тот или иной уровень априорной информации. Каждому уровню априорной информации о помехах соответствует определенный класс распределений , к которому принадлежит не известная нам истинная плотность распределения . Чем ниже уровень априорной информации о помехах, тем шире соответствующий класс распределений.

НЕ нашли? Не то? Что вы ищете?

Далее будем рассматривать только симметричные непрерывные унимодальные плотности распределения , имеющие конечную фишеровскую информацию (см. (2.1.69)):

. (2.2.1)

Естественно, все плотности распределения удовлетворяют условиям:

; . (2.2.2)

Приведем примеры типовых классов распределений, которые представляются наиболее естественными и удобными для описания априорной информации о помехах.

 — класс невырожденных распределений:

. (2.2.3)

Этот класс распределений наиболее широкий. В него входят все плотности распределения, для которых значение в нуле отлично от нуля. Условие принадлежности плотности распределения этому классу:  — по существу, близко к полному отсутствию априорной информации о помехах.

 — класс распределений с ограниченной дисперсией:

. (2.2.4)

 — класс приближенно нормальных распределений:

. (2.2.5)

Плотности распределения, входящие в этот класс, представляют собой смесь нормальной или гауссовой плотности распределения (см. табл.2.11) с нулевым средним и дисперсией и произвольной плотностью распределения. Параметр a, характеризует степень «засорения» нормальной плотности распределения.

 — класс приближенно экспоненциальных распределений:

.

Плотности распределения этого класса представляют собой смесь двойной экспоненциальной, или плотности распределения Лапласа (см. табл.3.1) с нулевым средним и параметром масштаба и произвольной неизвестной плотности распределения . Параметр a, характеризует степень близости к экспоненциальной плотности распределения .

 — класс приближенно равномерных распределений:

.

Входящие в этот класс распределения представляют собой смесь равномерной плотности распределения (см. табл.3.1) с нулевым средним и параметром финитности и произвольной неизвестной плотности распределения . Параметр a удовлетворяет условию .

 — класс финитных распределений:

.

Этот класс соответствует ограниченности по абсолютной величине помехи h. При этом какие-либо дополнительные сведения о плотности распределения помехи отсутствуют.

 — класс приближенно финитных распределений:

.

Параметр b, характеризует степень приближения к финитной плотности распределения. Условие, определяющее этот класс, означает, что с вероятностью имеет место неравенство . Очевидно, что класс финитных плотностей распределения является частным случаем класса .

Наряду с этими основными классами распределений введены более узкие классы, которые получаются из основных введением дополнительных ограничений снизу или сверху на дисперсии. Эти классы достаточно подробно описаны в работе [3].

Приведенные классы распределений хотя и не исчерпывают все возможности, но они достаточно типичны и соответствуют широкому диапазону уровней априорной информации о помехах.

Каждому классу F распределения помехи соответствует класс Q функции потерь. Причем, учитывая результаты предыдущей главы, класс Q будем формировать следующим образом:

. (2.2.6)

Тогда АМКО (3.53) можно представить в виде:

(2.2.7)

для " ( и ).

В том случае, когда совпадает с , АМКО принимает вид:

. (2.2.8)

Причем, как было показано в разд.3.6, (см. неравенство (2.1.69a, б))

(2.2.9а)

или, раскрывая и , можно записать:

(2.2.9б)

для любых и , принадлежащих классу F.

2.2.2. Использование игрового подхода в задаче определения

функции потерь

В предыдущей главе мы рассмотрели задачу определения оптимальной функции потерь. Эта задача легко решается при известной плотности распределения помехи, при этом (см. (2.1.62)).

В случае, когда плотность распределения неизвестна, а известен только класс распределения F, которому принадлежит эта плотность (), функция потерь уже не может быть найдена по формуле (2.1.62). В этом случае для нахождения функции потерь предлагается использовать игровой подход [3].

Прежде чем переходить непосредственно к решению задачи нахождения функции потерь, рассмотрим простую матричную игру двух соперников, заключающуюся в том, что игрок А теряет очки и его задача — как можно меньше потерять; игрок В приобретает очки, его задача — как можно больше приобрести. Сколько очков теряет А, столько очков приобретает В. При этом действия А сводятся к выбору какой-либо стратегии из допустимых стратегий (, ), а действия В сводятся к выбору стратегии из допустимых стратегий (, ). Для нашей задачи будем считать , хотя в общем случае это необязательно.

Положим , тогда можно составить некоторую платежную матрицу , например, такую (табл.2.2.1):

Таблица 2.2.1

А

В

b1

b2

b3

b4

max V(ai, bj)

bj

a1

3

5

2,6

4,5

5

a2

8,1

5,6

2

7,1

8,1

a3

8

2,2

1,5

9,3

9,3

a4

4,2

6,8

7,4

4

7,4

min V(ai, bj)

ai

3

2,2

1,5

4

5 = min max V(ai, bj); 4 = max min V(ai, bj).

ai bj bj ai

В клетках матрицы записаны проигрыши игрока А (выигрыши игрока В). Так, если А выбирает стратегию , а В — стратегию , то А проиграет 4,5 очка, а В, соответственно, 4,5 выиграет. Возникает вопрос, как должен вести себя игрок А (В), чтобы проиграть (выиграть) не слишком много (мало)?

Рассмотрим вначале действия игрока А. Если он выберет стратегию , то его возможный максимальный проигрыш составит 5 очков; запишем этот максимальный проигрыш в последнем столбце табл.2.2.1. Для стратегии максимальный проигрыш — 8,1; и т. д. Максимальные проигрыши по всем стратегиям игрока А записаны в последнем столбце табл.2.2.1. Очевидно, если А будет выбирать стратегию (именно этой стратегии соответствует минимальный элемент последнего столбца), то вне зависимости от того, какую стратегию выбирает В, он (игрок А) больше 5 очков не проиграет. Математически действия игрока А можно записать следующим образом:

; (2.2.10)

, (2.2.11)

где  — максимальный гарантированный проигрыш игрока А.

Очевидно,

, . (2.2.12)

Для игрока В рассуждения обратные. Если он выбирает стратегию , то его возможный минимальный выигрыш — 3 очка; записываем это значение в последней строке табл.2.2.1. Для  — 2,2 очка и т. д. Минимальные выигрыши записаны в последней строке. Максимальный элемент этой строки — 4 соответствует стратегии . Таким образом, если В будет выбирать стратегию , то вне зависимости от действий игрока А, он выиграет не меньше 4-х очков.

Запишем алгоритм действий игрока В в математической форме:

; (2.2.13)

, (2.2.14)

 — минимальный выигрыш игрока В:

, . (2.2.15)

В общем случае . Причем, если игроки А и В будут использовать свои оптимальные стратегии, то можно на основании (2.2.12),(2.2.5) записать неравенство:

. (2.2.16)

Рассмотрим теперь другую платежную матрицу (табл.2.2.2).

Таблица 2.2.2

А

В

b1

b2

b3

b4

max V(ai, bj)

bj

a1

5

2,6

4,5

3,8

5

a2

8,1

5,6

2

7,0

8,1

a3

8

2,2

1,5

9,3

9,3

a4

6,2

6,8

7,4

4

7,4

min V(ai, bj)

ai

5

2,2

2

3,8

5 = min max V(ai, bj); 5 = max min V(ai, bj).

ai bj bj ai

В этом случае, рассуждая аналогичным образом и определяя и по формулам (2.2.11) и (2.2.14), а также и по формулам (2.2.10), (2.2.13), получим:

. (2.2.16)

Объединяя неравенства (2.2.12) и (2.2.15), получим:

. (2.2.17)

Неравенство (2.2.17) является условием седловой точки, а точка () называется седловой.

Рассмотрим теперь задачу определения функции потерь, если известно, что плотность распределения помехи принадлежит некоторому классу F, содержащему возможных плотностей распределения , , и , т. е.

. (2.2.18)

Соответствующий класс функций потерь будет содержать возможных функции потерь:

. (2.2.19)

В зависимости от выбранной функции потерь и реализовавшейся плотности распределения могут возникнуть различных АМКО, которые рассчитываются по формулам (2.162) или (2.2.8), а именно:

, ; . (2.2.20)

, . (2.2.21)

Причем, как было показано в разд.2.1.6, справедливо неравенство:

; . (2.2.22)

Учитывая вышесказанное, можно составить платежную матрицу рассматриваемой задачи. Элементами этой матрицы являются АМКО, рассчитанные по формулам (2.2.20),(2.2.21). Возможный вариант такой матрицы приведен в табл.2.2.3, для наглядности в ячейках матрицы стоят следы АМКО.

Таблица 2.2.3

0,6

0,9

2,7

1,8

2,7

2,2

0,1

1,2

3,0

3,0

0,9

2,8

0,8

2,3

2,8

1,6

2,3

1,4

1,2

1,6

0,6

0,1

0,8

1,2

1,6 ; 1,2 .

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3