Семинар №12

ИГРЫ С УПОРЯДОЧЕННЫМИ ИСХОДАМИ

Игры при наличии нескольких критериев, т. е. выигрыш оценивается по нескольким критериям.

Рассмотрим следующий пример. Пусть ожидается эпидемия некоторого заболевания, который может быть вызван вирусами, условно обозначенными В1, В2, В3. Против данного типа вирусов могут быть использованы вакцины типа V1, …, V7. Предполагается, что чем больше номер вакцины i, тем меньше затраты αi (в некоторых условных единицах) на ее производство, пусть αi Î {1; 2; 3; 4; 5; 6; 7}. Эффективность вакцины типа Vi, i = 1, …, 7, оценивается величиной bi Î {1; 2; 3; 4} (чем больше значение bi, тем эффективнее вакцина).

Технология производства вакцины такова, что одновременно в массовом порядке может производиться вакцина только одного типа. Требуется определить, какого типа вакцину следует производить с целью минимизации затрат на производство (что позволит произвести больше вакцины при тех же затратах) и максимизации ее эффективности.

Введем понятие исхода R(Vi, Bj) = (ai, bi) – результата (выигрыша), отражающего как затраты αi на производство вакцины Vi, так и ее эффективность bi применительно к вирусу типа Bj. Тогда для поиска оптимального решения (стратегии производства) может быть использован критерий R(Vi, Bj) ® (max, max).

Поиск решения игры с упорядоченными исходами

Пусть задана табл. 1 возможных исходов. Нетрудно заметить, что проблемная ситуация моделируется игрой с «природой», где стратегиями (выборами) ЛПР являются типы вакцин, а состояниями «природы» (условиями) – типы вирусов. Поскольку вероятности состояний «природы» неизвестны, то в качестве критерия оптимальности выберем наиболее осторожный критерий Вальда, предварительно выделив наихудший исход для вакцины каждого типа.

НЕ нашли? Не то? Что вы ищете?

Таблица 1

Bj

Vi

B1

B2

B3

min(ai, bj)

V1

(1; 4)

(1; 3)

(1; 3)

(1; 3)

V2

(2; 3)

(2; 3)

(2; 4)

(2; 3)

V3

(3; 4)

(3; 3)

(3; 2)

(3; 2)

V4

(4; 3)

(4; 2)

(4; 3)

(4; 2)

V5

(5; 2)

(5; 3)

(5; 2)

(5; 2)

V6

(6; 3)

(6; 2)

(6; 1)

(6; 1)

V7

(7; 1)

(7; 2)

(7; 3)

(7; 1)

Применение критерия Вальда сводится к установлению отношения предпочтения (доминирования) на множестве выделенных исходов и удаления доминируемых исходов, а значит, и соответствующих им стратегий (вакцин) ЛПР (отмечены перечеркнутыми строками).

V2 V1

V5 V3, V4

V7 V6

В результате получаем множество эффективных (недоминируемых) решений Парето {V2, V5, V7}, для окончательного выбора из которого ЛПР необходима дополнительная информация. Например, если известно, что эпидемия не носит всеобщего характера (заболевают в основном дети и пожилые люди), но болезнь протекает тяжело, то предпочтение следует отдать наиболее дорогой, но и наиболее эффективной в целом вакцине типа V2. Для противоположного случая – всеобщность эпидемии при сравнительной легкости заболевания – целесообразно производить наиболее дешевую (но и менее эффективную) вакцину типа V7. Для промежуточного случая или при отсутствии дополнительной информации может быть рекомендована вакцина типа V5. Заметим, что если имеется достаточно средств, то следует производить наиболее эффективную вакцину V2.

Если для той же задачи, например, поступила информация, что ожидается вирус типа В3, то табл. 1 трансформируется в табл. 2.

Таблица 2

Bj

Vi

B3

V1

(1; 3)

V2

(2; 4)

V3

(3; 2)

V4

(4; 3)

V5

(5; 2)

V6

(6; 1)

V7

(7; 3)

Снова используя отношение доминирования на множестве исходов, получим множество эффективных решений Парето, состоящее только из двух решений (вакцин) V2 и V7. Привлекая дополнительную информацию о тяжести заболевания и его массовости, решается вопрос о том, какую из двух вакцин производить.