В экономике иногда приходится сталкиваться с ситуацией, когда при наличии многих участников эффективность решения одного из них зависит от того, какие решения приняли другие участники. Например, доход предприятия от продажи изделия зависит не только от установленной на него цены, но и от количества купленных покупателем изделий. Или при выборе ассортимента товаров, выпускаемых предприятием, нужно учитывать, какой ассортимент товаров выпускают другие предприятия.
Все ситуации, когда эффективность действия одного из участников зависит от действий других, можно разбить на два типа:
- интересы участников совпадают;
- интересы участников не совпадают.
Ситуации второго типа называют конфликтными. Построением математических моделей конфликтных ситуаций и разработкой методов решения возникающих в этих ситуациях задач занимается теория игр.
Задачей теории игр является выработка рекомендаций для игроков, т. е. определение для них оптимальной стратегии.
Стратегией игрока называется система правил, однозначно определяющих поведение игрока на каждом ходе в зависимости от ситуации, сложившейся в процессе игры.
Рассмотрим игру, в которой сталкиваются интересы двух противников – А и В. Пусть у игрока А имеется набор стратегий:
:
,
а у игрока В:
:
.
Будем рассматривать игру с точки зрения игрока
. Игроку
будут соответствовать строки, а игроку
- столбцы матрицы:
b1 | b2 | … | bn | r | |
a1 | w11 | w12 | w1n | r1 | |
a2 | w21 | w22 | … | w2n | r2 |
… | .. | .. | … | .. | .. |
am | wm1 | wm2 | … | wmn | rm |
s | s1 | s2 | .. | sn |
где
- выигрыш игрока
, если игрок
выберет стратегию
, а игрок
ответит на нее стратегией
;
могут быть положительными, отрицательными числами и равными нулю.
Если
, то игрок
выиграл, а
проиграл. Если
, то
проиграл, а
выиграл. Если же
, то никто не выиграл.
Предположим, игрок
считает, что игрок
ответит ему наихудшим для него (для
) способом.
Пусть
выбирает стратегию
. Тогда
ответит так: он просмотрит всю первую строку матрицы и выберет наименьшее число первой строки, т. е.
.
Просчитаем для каждой строки матрицы минимум, и сделаем столбец
.
Действия
: выбирает наилучшую для себя стратегию – максимум по столбцу
:
.
В результате возникла формула – цена игры для
:
.
Теперь рассмотрим игру с точки зрения игрока
. Игрок
ответит на игру
тоже наихудшим для
образом. Введем строку
, в которой каждое
является максимумом по столбцу:
.
Игрок
будет минимизировать свой проигрыш. Тогда цена игры с точки зрения игрока
будет равна:
.
Пример 6.1. Рассмотрим игру, заданную матрицей:
b1 | b2 | b3 | r | |
а1 | 0 | -1 | -2 | -2 |
а2 | 1 | 0 | -1 | -1 |
а3 | 2 | 1 | 0 | 0 |
s | 2 | 1 | 0 |
Найдем минимальные элементы в каждой строке таблицы и составим столбец
. Максимальный элемент в нем равен нулю.
Найдем максимальные элементы в каждом столбце матрицы и получим строку
, минимальный элемент которой также равен нулю. То есть
,
.
Таким образом, в этом примере цена игры для
совпала с ценой игры для
. Следовательно, есть оптимальное поведение для обоих игроков сразу: игрок
должен выбрать стратегию
, на это игрок
должен ответить стратегией
.
Определение. Если
, то говорят, что игра имеет седловую точку: есть оптимальное поведение для двух игроков сразу.
Если
:
, то игра не имеет седловой точки и оптимального поведения для обоих игроков не существует.
В этом случае выходом служит смешанная стратегия.
6.1. Смешанная стратегия
Определение. Смешанной стратегией для игрока
называется набор вероятностей
,
,
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |


