5. Задачи теории статистических решений. (статистические игры)

Близкой по идеям и методам к теории игр является теория статистических решений. От теории игр она отличается тем, что ситуация неопределенности не имеет конфликтной окраски – никто ни кому не противодействует, но налицо элемент неопределенности. В задачах теории статистических решений неизвестные условия операции зависят не от сознательно действующего противника, а от объективной действительности, которую в теории статистических решений принято называть “природой”. Соответствующие ситуации часто называют играми с природой (статистическими играми).

Часто эти ситуации вообще относят к теории игр, оговариваясь в определении игры, что одним из участников может быть среда (природа), действующая как сумма дезорганизующих обстоятельств, весь комплекс внешних условий, в которых игроку приходится принимать решение. Назовем этого игрока – статистиком.

Природа безразлична к выигрышу и не стремится обратить в свою пользу промахи статистика. Пусть статистик имеет m стратегий, а природа может реализовать n своих состояний. Если статистик имеет возможность оценить численно последствия каждой своей чистой стратегии при любом состоянии природы, то игру можно задать платежной матрицей. При упрощении платежной матрицы имеется специфика: нельзя отбрасывать те или иные стратегии “природы”, так как она может реализовать их вне зависимости от того, выгодны они статистику или нет.

При решении таких игр могут быть 2 ситуации:

· игроку А неизвестны вероятности pj, с которыми природа реализует свои состояния;

НЕ нашли? Не то? Что вы ищете?

· вероятности pj известны.

Для принятия решения в таких играх используют различные критерии.

Если вероятности pj состояний природы неизвестны, то можно пользоваться критериями Вальда, Лапласа, Сэвиджа, Гурвица и пр. Основное различие между названными критериями определяется стратегией поведения лица, принимающего решение в условиях неопределенности. Например, критерий Лапласа основан на более оптимистичных предположениях, чем критерий Вальда. Критерий Гурвица можно использовать при различных подходах: от наиболее оптимистичного до наиболее пессимистичного. Таким образом, перечисленные критерии, несмотря на их количественную природу, отражают субъективную оценку ситуации, в которой статистику приходится принимать решение. К сожаленью, не существует общих правил оценки применимости того или иного критерия, так как поведение лица, принимающего решение, по всей видимости, является наиболее важным фактором при выборе подходящего критерия. Сформулируем эти критерии.

1. Критерий Лапласа

Этот критерий опирается на принцип недостаточного обоснования, по которому считается, что наступление всех состояний природы равновероятно, то есть p1=p2=...=pn=1/n, а оптимальной считается стратегия Ai, обеспечивающая

. (5.1)

2. Критерий Вальда (минимаксный или максминный критерий)

Этот критерий является наиболее осторожным, поскольку основан на выборе наилучшей из наихудших возможностей:

– в случае нахождения выигрыша;

– в случае нахождения потерь.

Это пессимистические критерии.

3. Критерий Сэвиджа (минимаксного риска)

Критерий Вальда настолько пессимистичен, что может привести к нелогичным выводам. Рассмотрим следующую матрицу потерь, которая обычно приводится в качестве классического примера для обоснования “менее пессимистичного” критерия Сэвиджа.

В1

В2

А1

11000

90

А2

10000

10000

Применение минимаксного критерия приводит к выбору стратегии А2, хотя интуитивно можно выбрать А1, так как при этом выборе можно надеется проиграть 90, тогда как выбор А2 всегда приводит к потерям в 10000 единиц при любом состоянии погоды..

Критерий Сэвиджа “исправляет” положение введением новой матрицы потерь, в которой заменяются на , определяемые следующим образом:

Это означает, что есть разность между наилучшим значением в столбце j и значением .

По существу, выражает сожаление лица, принимающего решение, по поводу того, что он не выбрал наилучшего действия относительно состояния j. МатрицаR=()êназывается матрицей сожаления или матрицей риска.

Найдем оптимальную стратегию предыдущей задачи по этому критерию:

.

Применим к матрице “сожаления” R минимаксный критерий. Получим, что оптимальной стратегией будет– А1.

Отметим, что независимо от того, – доход или потери, – всегда потери. Поэтому к матрице “сожаления” всегда применяется минимаксный критерий.

4. Критерий Гурвица (пессимизма-оптимизма)

Этот критерий охватывает ряд различных подходов к принятию решений: от наиболее оптимистичного до наиболее пессимистичного.

При оптимистичном подходе выбирают стратегию, дающую:

, если – выигрыш, и

, если – потери.

Аналогично при наиболее пессимистичных предположениях выбираемое решение соответствует:, если – выигрыш, и

, если – потери.

Критерий Гурвица устанавливает баланс между случаями крайнего оптимизма и пессимизма взвешиванием обоих способов поведения с соответствующими весами a и 1-a, где 0£a£1.

Если – прибыль, то выбирается стратегия по правилу:

Если – затраты, критерий выбирает стратегию, дающую

Параметр a интерпретируется как показатель оптимизма; при a=1 критерий слишком оптимистичный, при a=0 он слишком пессимистичный. Значение a между 0 и 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. a=0,5 представляется наиболее разумным.

Анализ практических ситуаций обычно проводится на основе нескольких критериев, что позволяет глубже исследовать суть явления.

Пример.

Одно из предприятий должно определить уровень предложения услуг так, чтобы удовлетворить потребности клиентов. Точное число клиентов не известно, но ожидается, что оно может принимать одно из следующих значений: 200, 250, 300, 350. Для каждого из этих возможных значений существует наилучший уровень предложения (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения предложения над спросом, либо из-за неполного удовлетворения спроса.

Потери в зависимости от ситуации приведены в следующей таблице:


Клиенты

Предложен.

1

2

3

4

max

a1

5

10

18

25

25

a2

8

7

8

23

23

a3

21

18

12

21

21

a4

30

22

19

15

30

· Критерий Вальда. Так как – потери, применяем минимаксный критерий.

. Оптимальной стратегией будет А3.

· Критерий Лапласа. Пусть стратегии 2-го игрока равновероятны. Следовательно . Тогда:

Таким образом, наилучшим уровнем предложения в соответствии с критерием Лапласа будет стратегия А2.

· Критерий Сэвиджа. Построим матрицу риска:

Лучшая стратегия А2.

· Критерий Гурвица. Пусть a=1/2.

А1

5

25

5/2+25/2=15

А2

7

23

7/2+23/2=15

А3

12

21

12/2+21/2=16,5

А4

15

30

15/2+30/2=22,5

Лучшие стратегии А1 и А2.

В соответствии с 3-мя критериями рекомендуется выбрать 2 стратегию.

Если находить решение методами теории игр, то сначала ищем наличие седловой точки:

.

.

Эта игра имеет седловую точку и оптимальной будет стратегия А3.

5. Критерий Байеса

Если вероятности состояний природы pj известны, то можно пользоваться критерием Байеса, согласно которому:

оптимальной считается чистая стратегия, соответствующая максимальному среднему выигрышу: , если – выигрыш и минимальным средним потерям: , если –потери.

Если в предыдущем примере известны вероятности спроса , то для нахождения оптимальной стратегии необходимо найти средние потери для каждой чистой стратегии предприятия и выбрать ту, которая обеспечивает минимум средних потерь: ®стратегия А2.

Можно показать, что та стратегия, которая обращает в максимум средний выигрыш, обращает в минимум и средний риск.

Все рассмотренные критерии были сформулированы для чистых стратегий, но каждый из них может быть распространен и на смешанные стратегии, подобно тому, как это делается в теории игр. В теории статистических решений смешанные стратегии имеют смысл при многократном повторении игры.

Но многократно повторяя игру, можно определить частоты повторений той или иной ситуации и в дальнейшем применять стохастический подход к задаче принятия решений.

Если использовать смешанные стратегии, то критерий Вальда формулируется следующим образом: оптимальной будет смешанная стратегия , обеспечивающая , т. е. максимизирующая средний выигрыш( если –выигрыш)

Критерий Сэвиджа для смешанных стратегий: оптимальной считается та смешанная стратегия, при которой максимальный средний риск статистика минимален, то есть стратегия , найденная из условия .

Оптимальные смешенные стратегии в этом случае находятся также, как в обычной матричной игре.