2.2. Использование принципов игрового подхода
в задачах идентификации
2.2.1. Априорная информация о помехах
и классах распределений
Опыт практического применения оптимальных методов оценивания показывает, что они весьма чувствительны к обычно имеющимся на практике нарушениям условий их оптимальности и вследствие этого оказываются малоэффективными. Задачей теории робастности является разработка таких статистических процедур, которые лишь незначительно уступают в эффективности классическим оптимальным процедурам при точном выполнении условий их оптимальности и сохраняют высокую эффективность при нарушении этих условий.
Термин «робастный» (rоbust — сильный, крепкий) в указанном выше смысле был введен в употребление Боксом в 1953 г. Методы, разработанные теорией робастности, имеют важное практическое значение для повышения эффективности статистических процедур при решении задач идентификации, фильтрации, обнаружения, распознавания образов и других.
Особые трудности при реализации классических оптимальных методов связаны с предположением о том, какому закону распределения подчиняются случайные помехи. Как правило, плотность распределения помех
полностью неизвестна. Однако могут быть известны какие-либо сведения о
, которые определяют тот или иной уровень априорной информации. Каждому уровню априорной информации о помехах соответствует определенный класс распределений
, к которому принадлежит не известная нам истинная плотность распределения
. Чем ниже уровень априорной информации о помехах, тем шире соответствующий класс распределений.
Далее будем рассматривать только симметричные непрерывные унимодальные плотности распределения
, имеющие конечную фишеровскую информацию (см. (2.1.69)):
. (2.2.1)
Естественно, все плотности распределения удовлетворяют условиям:
;
. (2.2.2)
Приведем примеры типовых классов распределений, которые представляются наиболее естественными и удобными для описания априорной информации о помехах.
— класс невырожденных распределений:
. (2.2.3)
Этот класс распределений наиболее широкий. В него входят все плотности распределения, для которых значение в нуле отлично от нуля. Условие принадлежности плотности распределения этому классу:
— по существу, близко к полному отсутствию априорной информации о помехах.
— класс распределений с ограниченной дисперсией:
. (2.2.4)
— класс приближенно нормальных распределений:
. (2.2.5)
Плотности распределения, входящие в этот класс, представляют собой смесь нормальной или гауссовой плотности распределения
(см. табл.2.11) с нулевым средним и дисперсией
и произвольной плотностью распределения. Параметр a,
характеризует степень «засорения» нормальной плотности распределения.
— класс приближенно экспоненциальных распределений:
.
Плотности распределения этого класса представляют собой смесь двойной экспоненциальной, или плотности распределения Лапласа
(см. табл.3.1) с нулевым средним и параметром масштаба
и произвольной неизвестной плотности распределения
. Параметр a,
характеризует степень близости
к экспоненциальной плотности распределения
.
— класс приближенно равномерных распределений:
.
Входящие в этот класс распределения представляют собой смесь равномерной плотности распределения
(см. табл.3.1) с нулевым средним и параметром финитности
и произвольной неизвестной плотности распределения
. Параметр a удовлетворяет условию
.
— класс финитных распределений:
.
Этот класс соответствует ограниченности по абсолютной величине помехи h. При этом какие-либо дополнительные сведения о плотности распределения помехи отсутствуют.
— класс приближенно финитных распределений:
.
Параметр b,
характеризует степень приближения
к финитной плотности распределения. Условие, определяющее этот класс, означает, что с вероятностью
имеет место неравенство
. Очевидно, что класс финитных плотностей распределения
является частным случаем класса
.
Наряду с этими основными классами распределений введены более узкие классы, которые получаются из основных введением дополнительных ограничений снизу или сверху на дисперсии. Эти классы достаточно подробно описаны в работе [3].
Приведенные классы распределений хотя и не исчерпывают все возможности, но они достаточно типичны и соответствуют широкому диапазону уровней априорной информации о помехах.
Каждому классу F распределения помехи соответствует класс Q функции потерь. Причем, учитывая результаты предыдущей главы, класс Q будем формировать следующим образом:
. (2.2.6)
Тогда АМКО (3.53) можно представить в виде:
![]()
(2.2.7)
для " (
и
)
.
В том случае, когда
совпадает с
, АМКО принимает вид:
. (2.2.8)
Причем, как было показано в разд.3.6, (см. неравенство (2.1.69a, б))
(2.2.9а)
или, раскрывая
и
, можно записать:
(2.2.9б)
для любых
и
, принадлежащих классу F.
2.2.2. Использование игрового подхода в задаче определения
функции потерь
В предыдущей главе мы рассмотрели задачу определения оптимальной функции потерь. Эта задача легко решается при известной плотности распределения помехи, при этом
(см. (2.1.62)).
В случае, когда плотность распределения неизвестна, а известен только класс распределения F, которому принадлежит эта плотность (
), функция потерь уже не может быть найдена по формуле (2.1.62). В этом случае для нахождения функции потерь предлагается использовать игровой подход [3].
Прежде чем переходить непосредственно к решению задачи нахождения функции потерь, рассмотрим простую матричную игру двух соперников, заключающуюся в том, что игрок А теряет очки и его задача — как можно меньше потерять; игрок В приобретает очки, его задача — как можно больше приобрести. Сколько очков теряет А, столько очков приобретает В. При этом действия А сводятся к выбору какой-либо стратегии из допустимых
стратегий (
,
), а действия В сводятся к выбору стратегии из допустимых
стратегий (
,
). Для нашей задачи будем считать
, хотя в общем случае это необязательно.
Положим
, тогда можно составить некоторую платежную матрицу
, например, такую (табл.2.2.1):
Таблица 2.2.1
А | В | ||||
b1 | b2 | b3 | b4 | max V(ai, bj) bj | |
a1 | 3 | 5 | 2,6 | 4,5 | 5 |
a2 | 8,1 | 5,6 | 2 | 7,1 | 8,1 |
a3 | 8 | 2,2 | 1,5 | 9,3 | 9,3 |
a4 | 4,2 | 6,8 | 7,4 | 4 | 7,4 |
min V(ai, bj) ai | 3 | 2,2 | 1,5 | 4 | — |
5 = min max V(ai, bj); 4 = max min V(ai, bj).
ai bj bj ai
В клетках матрицы записаны проигрыши игрока А (выигрыши игрока В). Так, если А выбирает стратегию
, а В — стратегию
, то А проиграет 4,5 очка, а В, соответственно, 4,5 выиграет. Возникает вопрос, как должен вести себя игрок А (В), чтобы проиграть (выиграть) не слишком много (мало)?
Рассмотрим вначале действия игрока А. Если он выберет стратегию
, то его возможный максимальный проигрыш составит 5 очков; запишем этот максимальный проигрыш в последнем столбце табл.2.2.1. Для стратегии
максимальный проигрыш — 8,1; и т. д. Максимальные проигрыши по всем стратегиям игрока А записаны в последнем столбце табл.2.2.1. Очевидно, если А будет выбирать стратегию
(именно этой стратегии соответствует минимальный элемент последнего столбца), то вне зависимости от того, какую стратегию выбирает В, он (игрок А) больше 5 очков не проиграет. Математически действия игрока А можно записать следующим образом:
; (2.2.10)
, (2.2.11)
где
— максимальный гарантированный проигрыш игрока А.
Очевидно,
,
. (2.2.12)
Для игрока В рассуждения обратные. Если он выбирает стратегию
, то его возможный минимальный выигрыш — 3 очка; записываем это значение в последней строке табл.2.2.1. Для
— 2,2 очка и т. д. Минимальные выигрыши записаны в последней строке. Максимальный элемент этой строки — 4 соответствует стратегии
. Таким образом, если В будет выбирать стратегию
, то вне зависимости от действий игрока А, он выиграет не меньше 4-х очков.
Запишем алгоритм действий игрока В в математической форме:
; (2.2.13)
, (2.2.14)
— минимальный выигрыш игрока В:
,
. (2.2.15)
В общем случае
. Причем, если игроки А и В будут использовать свои оптимальные стратегии, то можно на основании (2.2.12),(2.2.5) записать неравенство:
. (2.2.16)
Рассмотрим теперь другую платежную матрицу (табл.2.2.2).
Таблица 2.2.2
А | В | ||||
b1 | b2 | b3 | b4 | max V(ai, bj) bj | |
a1 | 5 | 2,6 | 4,5 | 3,8 | 5 |
a2 | 8,1 | 5,6 | 2 | 7,0 | 8,1 |
a3 | 8 | 2,2 | 1,5 | 9,3 | 9,3 |
a4 | 6,2 | 6,8 | 7,4 | 4 | 7,4 |
min V(ai, bj) ai | 5 | 2,2 | 2 | 3,8 | — |
5 = min max V(ai, bj); 5 = max min V(ai, bj).
ai bj bj ai
В этом случае, рассуждая аналогичным образом и определяя
и
по формулам (2.2.11) и (2.2.14), а также
и
по формулам (2.2.10), (2.2.13), получим:
![]()
. (2.2.16)
Объединяя неравенства (2.2.12) и (2.2.15), получим:
. (2.2.17)
Неравенство (2.2.17) является условием седловой точки, а точка (
) называется седловой.
Рассмотрим теперь задачу определения функции потерь, если известно, что плотность распределения помехи принадлежит некоторому классу F, содержащему
возможных плотностей распределения
,
,
и
, т. е.
. (2.2.18)
Соответствующий класс функций потерь будет содержать
возможных функции потерь:
. (2.2.19)
В зависимости от выбранной функции потерь
и реализовавшейся плотности распределения
могут возникнуть
различных АМКО, которые рассчитываются по формулам (2.162) или (2.2.8), а именно:
![]()
,
;
. (2.2.20)
![]()
,
. (2.2.21)
Причем, как было показано в разд.2.1.6, справедливо неравенство:
;
. (2.2.22)
Учитывая вышесказанное, можно составить платежную матрицу рассматриваемой задачи. Элементами этой матрицы являются АМКО, рассчитанные по формулам (2.2.20),(2.2.21). Возможный вариант такой матрицы приведен в табл.2.2.3, для наглядности в ячейках матрицы стоят следы АМКО.
Таблица 2.2.3
|
| ||||
|
|
|
|
| |
| 0,6 | 0,9 | 2,7 | 1,8 | 2,7 |
| 2,2 | 0,1 | 1,2 | 3,0 | 3,0 |
| 0,9 | 2,8 | 0,8 | 2,3 | 2,8 |
| 1,6 | 2,3 | 1,4 | 1,2 | 1,6 |
| 0,6 | 0,1 | 0,8 | 1,2 | — |
1,6
; 1,2
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 |


