Типовой расчет по теории игр
ВАРИАНТ 9
Задача 1. Принятие решений в условиях неопределенности.
Фермер может засеять поле четырьмя сортами пшеницы. Затраты на все семена, а также на обработку почвы одинаковы. Год может быть засушливым, нормальным и дождливым. Известны урожайности культур в зависимости от погоды и цена центнера для каждого сорта. Составить матрицу выигрышей фермера. Дать рекомендации фермеру согласно критериям: Лапласа, максиминный критерий Вальда, критерий Гурвица (
), критерий Сэвиджа.
Из наблюдений за погодой в течении ста лет известно, что 50% лет была нормальная погода, засушливыми были 20% лет, а дождливыми – 30%. Дать рекомендации фермеру по критериям: максимум ожидаемой полезности, Ходжеса-Лемана (
), наиболее вероятного состояния природы, минимума ожидаемых сожалений.
Сделать общий вывод.
Погода | Урожайность пшеницы в центнерах | |||
П – 1 | П – 2 | П – 3 | П – 4 | |
Сухая | 20 | 8 | 0 | 1 |
Нормальная | 9 | 13 | 7,5 | 6,5 |
Дождливая | 12 | 7 | 10 | 9 |
Цена (у. е./ц) | 9 | 11 | 13 | 13 |
Решение. I. Составим матрицу выигрышей фермера, для этого урожайность (ц) умножим на цену для каждого центнера (у. е./ц)
|
|
| |
| 180 | 81 | 108 |
| 88 | 143 | 77 |
| 0 | 97,5 | 130 |
| 13 | 84,5 | 117 |
Где
- стратегии игрока А (фермера),
- стратегии игрока В (погоды), ![]()
1) Критерий Лаласа (равновозможный состояний).
Критерий равновозможных состояний основан на предположении Лапласа, согласно которому, если вероятности состояний абсолютно неизвестны, то они предполагаются быть равными. Согласно этому критерию выбирается то действие, сумма значений полезности которого по всем состояниям природы максимальна.
Т. к.
- матрица выигрышей, то найдем наибольшую сумму элементов
:
|
|
|
| |
| 180 | 81 | 108 | 369 |
| 88 | 143 | 77 | 308 |
| 0 | 97,5 | 130 | 227,5 |
| 13 | 84,5 | 117 | 214,5 |
. Первое действие дает максимальное значение суммарной полезности. Оптимальной стратегией является стратегия
.
2) Найдем оптимальную стратегию выигрыша игрока А по максиминному критерию Вальда -
.
|
|
|
| |
| 180 | 81 | 108 | 81 |
| 88 | 143 | 77 | 77 |
| 0 | 97,5 | 130 | 0 |
| 13 | 84,5 | 117 | 13 |
. Оптимальная стратегия – стратегия
.
Критерий максимина является перестраховочным, поскольку природа не может быть сознательным противником. По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния природы, т. е. в нашем случае при наихудшем состоянии природы, оптимальной стратегией будет посадка сорта пшеницы П-1.
3) Используем критерий Гурвица (
).
Критерий Гурвица является в некотором смысле компромиссным критерием и использует линейную комбинацию оптимистического и пессимистического подходов.
Воспользуемся формулой ![]()
|
|
|
| |
| 180 | 81 | 108 | 0,5*81+0,5*180=130,5 |
| 88 | 143 | 77 | 0,5*77+0,5*143=110 |
| 0 | 97,5 | 130 | 0,5*0+0,5*130=65 |
| 13 | 84,5 | 117 | 0,5*13+0,5*117=65 |
. Оптимальной является стратегия
.
Отсюда оптимальное действие – это посев пшеницы сорта П-1, т. к. это действие соответствует максимальному значению выражения
.
4) Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т. е. обеспечивается
, где
.
Фактически для принятия решений используется критерий минимакса (минимум из максимальных значений), но не для матрицы полезности, а для матрицы сожалений.
Построим матрицу сожалений:
| ||||
180-180=0 | 143-81=62 | 130-108=22 | 62 | |
180-88=92 | 143-143=0 | 130-77=53 | 92 | |
180-0=180 | 143-97,5=45,5 | 130-130=0 | 180 | |
180-13=167 | 143-84,5=58,5 | 130-117=13 | 167 |
. Оптимальная стратегия -
. Следовательно, оптимально действие – посев пшеницы сорта П-1.
Согласно 4-м рассмотренным критериям – оптимальная стратегия выигрышей игрока А – стратегия
. Следовательно, фермеру можно дать следующую рекомендацию: оптимальным выигрышем для фермера (по цене за выращенную пшеницу в зависимости от погоды) будет засеять первый сорт пшеницы (П – 1).
II. 1) Критерий максимума ожидаемой полезности (критерий Байеса).
Согласно данному критерию оптимальное действие имеет максимальную ожидаемую полезность.
Согласно условию, вероятности стратегий:
- 0,5,
- 0,2,
- 0,3.
Тогда, согласно критерию ожидаемой полезности:
, где
.
|
|
|
| |
| 180 | 81 | 108 | 180*0,5+81*0,2+108*0,3=138,6 |
| 88 | 143 | 77 | 88*0,5+143*0,2+77*0,3=95,7 |
| 0 | 97,5 | 130 | 0*0,5+97,5*0,2+130*0,3=58,5 |
| 13 | 84,5 | 117 | 13*0,5+84,5*0,2+117*0,3=58,5 |
. Оптимальная стратегия – стратегия
. Следовательно, оптимальное действие для фермера – посев пшеницы сорта П-1.
2) Используем критерий Ходжеса-Лемана (
).
Критерий Ходжа-Лемана базируется одновременно на критериях максимина Вальда и максимума ожидаемой полезности.
![]()
|
|
|
|
|
| |
| 180 | 81 | 108 | 138,6 | 81 | 109,8 |
| 88 | 143 | 77 | 95,7 | 77 | 86,35 |
| 0 | 97,5 | 130 | 58,5 | 0 | 29,25 |
| 13 | 84,5 | 117 | 58,5 | 13 | 35,75 |
. Оптимальная стратегия -
. Отсюда оптимальное действие – это выбрать для посева сорт пшеницы П-1, т. к. это действие соответствует максимальному значению величины
.
3) Критерий наиболее вероятного состояния природы (критерий максимакса) ориентирует статистику на самые благоприятные состояния природы -
, вероятность которых максимальна. Задача решается в условиях полной определенности в предположении, что обязательно будет иметь место выбранное состояние.
|
|
|
| |
| 180 | 81 | 108 | 180 |
| 88 | 143 | 77 | 143 |
| 0 | 97,5 | 130 | 130 |
| 13 | 84,5 | 117 | 117 |
. Оптимальная стратегия – стратегия
. Следовательно, оптимальное действие – посев пшеницы сорта П-1.
Следует отметить, что критерий наиболее вероятного состояния природы используется достаточно редко и в основном при существенном различии между максимальной вероятностью и остальными вероятностями состояния природы.
4) Критерий минимума ожидаемых сожалений.
Согласно данному критерию, вычисляется матрица сожалений и затем для каждого действия вычисляется ожидаемое сожаление как математическое ожидание функции сожалений. Оптимальное действие соответствует минимальному значению ожидаемого сожаления.
, где
.
Матрицу ожидаемых сожалений возьмем из пункта I, 4 (критерий Сэвиджа).
| ||||
0 | 62 | 22 | 19 | |
92 | 0 | 53 | 61,9 | |
180 | 45,5 | 0 | 99,1 | |
167 | 58,5 | 13 | 99,1 |
Минимальное значение ожидаемого сожаления:
. Следовательно – оптимальная стратегия
, а оптимальное действие – посев пшеницы сорта П-1.
Вывод. Рассмотрев все стратегии можно сделать вывод, что при данных условиях погоды для 4-х сортов пшениц, оптимальным для получения большего дохода, в у. е. (выигрыша), будет посадить первый сорт пшеницы; посадка второго сорта даст средний доход, значительно ниже дохода от пшеницы первого сорта. Сорта пшеницы 3-й и 4-й дадут самый маленький доход из представленных сортов.


