Упражнение 11.7(**). Решите предыдущую игру для Т = 2, 3, ... Покажите, что xi стремится к 1/(1 + δ), когда Т стремится к бесконечности.

Вместо решения примера с конечной продолжительностью (см. упражнение 11.7) мы сосредоточимся на рассмотрении примера с бесконечной продолжительностью, чтобы показать, как непосредственно обратную индукцию можно заменить использованием оценочных функций. Предположим, что продолжительность бесконечна. При условии, что игра не кончается (не принято ни одно из предложений), она «выглядит одинаковой» на всех нечетных шагах; аналогично для четных шагов. Мы будем, таким образом, искать «стационарные стратегии»: когда игрок 1 делает предложение, он всегда предлагает х1; когда игрок 2 делает предложение, он всегда предлагает х2. Эти предложения и любые, более благоприятные для отвечающего игрока всегда принимаются; любые предложения, менее благоприятные для отвечающего игрока, отвергаются.

Пусть Vi обозначает оценку i-го игрока при подходе его очереди делать предложение. Иными словами, Vi – выигрыш, на который рассчитывает игрок ш, делая (оптимальное) предложение. Пусть Wi – оценка i-го игрока при подходе очереди другого игрока делать предложение. Отметим, что, поскольку стратегии стационарны, эти оценки не зависят от времени. Кроме того, отметим, что в силу определения х1 и х2

V1 = x1, W2 = l – x1; V2 =1 – x2, W2 = x2

и что

V1 + W2 = V2 + W1 =1.

Теперь, когда игрок 1 делает предложение, он предлагает игроку 2 такую долю, которая делает его безразличным к тому, чтобы принять предложение сейчас или выждать еще один шаг (предложение более крупной доли было бы лишено смысла). Таким образом,

1 – x1 = δ(1 – x2)

или

W2 = δV2.

И точно так же, когда игрок 2 делает предложение,

х2 = δx1

или

W1 = δV1.

Так как игра симметрична, V1 = V2 = V и W1 = W2 = W. Таким образом, W = δV и V + W = 1 приводят к V = 1/(1 + δ) и W = δ/(1 + δ). Поэтому игрок, делающий предложение, получает 1/(1 + δ), другой получает остальную часть пирога: δ/(1 + δ). Равновесные стратегии таковы: предлагающий игрок предлагает долю δ /(1 + δ) отвечающему игроку; последний принимает любую долю, равную, по крайней мере, δ /(1+ δ), и отвергает любую меньшую долю.

Отметим, что данное равновесие является пределом равновесия в игре с конечной продолжительностью, когда Т стремится к бесконечности (см. упражнение 11.7). Рубинштейн показал, что оно также является единственным равновесием в игре с бесконечной продолжительностью.*

* Вообще говоря, игры с бесконечной продолжительностью могут иметь другие равновесия, отличные от пределов равновесий игры с конечной продолжительностью, когда последняя стремится к бесконечности. Примеры см. в главе 6 и подразделе 11.3.2. Исследование связи между ними см. в [21].

Упражнение 11.8(***). Покажите, что равновесие в игре с бесконечной продолжительностью единственно. Указание: введите следующие оценки: (соответственно Vi) – наибольший (соответственно наименьший) возможный выигрыш i-го игрока в множестве абсолютных равновесий при подходе его очереди делать предложение. Определите и Wi аналогичным образом. Каково соотношение между этими числами? Сделайте вывод, что = Vi = 1/(1 + δ) и.

Упражнение 11.9(*). Рассмотрим следующую простую игру инспектирования. Фирма может выбрать антиконкурентное действие (т. е. нанести ущерб) или не выбрать его. Нанесение ущерба дает ей (дополнительный) денежный выигрыш g > 0. Антитрестовские органы могут провести инспектирование или не провести его. Затраты на это инспектирование равны с > 0. Если фирма нанесла ущерб и проводится инспектирование, она платит штраф р > g; выигрыш антитрестовских органов составляет s – с > 0. Если фирма не наносила ущерба и проводится инспектирование или если инспектирование не проводится, выигрыш органов власти составляет – с или 0 соответственно.

1. Предположим, что до принятия решения об инспектировании антитрестовский орган наблюдает, состоялось ли хищническое действие. Постройте дерево этой игры. Каково абсолютное равновесие?

2. Предположим, что до принятия решения об инспектировании не наблюдается, состоялось ли хищническое действие. Постройте дерево игры. Докажите, что равновесие в чистых стратегиях не существует. Вычислите равновесие в смешанных стратегиях. Как изменение штрафа влияет на это равновесие?

11.3.2. Игры с «почти полной» информацией

Предположим, что игру можно разложить на ряд шагов t = 1,2,...,T (где Т конечно или бесконечно) и что на каждом шаге t игроки одновременно выбирают альтернативы, зная все альтернативы, выбранные каждым игроком от шага 1 до t – 1. Поскольку такая игра вводит одновременность только в рамках шага, мы называем такие развернутые формы играми с «почти полной» информацией* Простейшим примером такой игры является «повторяющаяся игра», в которой простая одношаговая игра с одновременными ходами (такая, как изображена на рис. 11.2 и в табл. 11.2-11.4) повторяется Т раз и в момент t игроки знают все ходы, сделанные до t. В повторяющейся игре нет физической связи между шагами.** Напротив, последовательная количественно-ценовая игра в главе 5 и игры с входом, предоставлением входа и выходом в главах 7-9 включают физические связи через всевозможные инвестиции. Например, когда фирмы обучаются делом, ценовая конкуренция в t выглядит иначе, чем ценовая конкуренция в t – 1, так как изменилась структура затрат. Здесь достаточно дать краткое введение в повторяющиеся игры. (Более подробно о повторяющихся играх см. в главе 6.)

НЕ нашли? Не то? Что вы ищете?

* В отечественной литературе такие игры называются «динамическими одновременными играми». – Прим. ред.

** Одношаговая игра с одновременными ходами называется избирательной игрой. На каждом шаге начинается собственная подыгра для каждой предыстории.

Пример: повторяющиеся игры. Вернемся к игре «Дилемма заключенного», описанной в разделе 11.2, и предположим, что игроки играют в нее повторно (попутно узнавая прошлые ходы). Предположим, что выигрыш каждого игрока равен настоящей дисконтированной
ценности пошаговых выигрышей при заданной продолжительности (коэффициент дисконтирования 6 из интервала (0, 1)). Сначала предположим, что имеется конечное число шагов Т. Для того чтобы найти абсолютное равновесие, необходимо вести анализ в обратном направлении от конца игры. На шаге Т стратегии должны определять равновесие по Нэшу для любой предыстории. Так как выигрыши на шаге Т раздельны и на них не влияет история, стратегии должны определить равновесие по Нэшу для одношаговой игры. Поэтому с учетом раздела 11.2 для любой истории. Оба игрока предают. Рассмотрим шаг Т – 1. Стратегии должны образовать двухшаговое равновесие по Нэшу для любой истории. Однако два последних шага физически не зависят от истории, и исход шага Т не зависит от происходящего на шаге Т – 1. Следовательно, стратегии в Т – 1 также должны образовать одношаговое равновесие по Нэшу. Таким образом, оба игрока предают в момент Т – 1. В силу обратной индукции они предают на всех шагах. Это часть более общего результата: если равновесие однопериодной игры единственно, то равновесие Т-шаговой игры является просто повторением этого равновесия Т раз.* Данное свойство не выполняется, когда Т = +∞ (имеет место «разрыв на бесконечности»). Предательство обоих игроков на каждом шаге независимо от истории все еще образует абсолютное равновесие. При условии, что на будущие исходы не влияет текущая игра (они в любом случае предадут), оба игрока должны максимизировать свои текущие выигрыши посредством предательства. Но существуют и другие равновесия. Рассмотрим, например, следующие симметричные стратегии: в любой момент t игрок кооперирует тогда, и только тогда, когда оба игрока всегда кооперировали от момента 1 до t – 1. В момент 1 оба кооперируют. Это образует абсолютное равновесие, если δ > 1/5. В подыгре, начинающейся в момент t, в которой один игрок предал в прошлом, оба предают непрестанно. Нам уже известно, что такие стратегии абсолютны (и, следовательно, абсолютны по Нэшу). В подыгре, в которой еще никто не предал, стратегии также образуют равновесие по Нэшу; они дают

начиная с t и далее. Если бы игрок отклонился и предал в момент t, он бы получил

так как, начиная с t + 1 и далее, обе стратегии предписывают «предавать непрестанно». Таким образом, чтобы игрок сотрудничал, нам нужно

(долгосрочный выигрыш от поддержания сотрудничества превышает краткосрочный выигрыш от отклонения), что в итоге дает δ > 1/5.

· * Комбинации одношаговых равновесий составляют лишь некоторые из многих равновесий, когда одношаговая игра имеет множество равновесий. Общий результат см. в [7]; простое применение к повторяющейся игре Курно см. в [18].

Существует много других равновесий для игр с бесконечной продолжительностью. Так называемая народная теорема дает точную характеристику множества абсолютных равновесий в повторяющихся играх общего вида с бесконечной продолжительностью, когда коэффициент дисконтирования очень близок к 1.*

*' Народная теорема утверждает, что любой возможный выигрыш, превышающий «индивидуально рациональные выигрыши», – индивидуально рациональный выигрыш игрока i есть минимальный выигрыш, получить который его могли бы вынудить другие игроки в одношаговой игре:

может в среднем поддерживаться как выигрыш при абсолютном равновесии в играх с бесконечным повторением для δ = 1 [5, 57] или при слабом условии для δ, близкой к 1 [22]. Например, в игре «Дилемма заключенного» оказывается, что индивидуально рациональные выигрыши совпадают с равновесными выигрышами (–2, –2) в одношаговой игре. Набор равновесных выигрышей в бесконечно повторяющихся играх составляет, таким образом, набор выпуклых комбинаций четырех пар выигрышей на рис. 11.3. Коэффициенты дисконтирования меньше 1 см. в [1]. Дополнительный раздел в главе 6 содержит более полное обсуждение народной теоремы.

11.4. Байесовское равновесие

11.4.1. Игры с несовершенной или неполной информацией

Специалисты по теории игр проводят различие между несовершенной и неполной информацией. Грубо говоря, игрок обладает несовершенной информацией тогда, когда ему неизвестно, что сделали другие игроки раньше.* С другой стороны, игрок обладает несовершенной информацией тогда, когда ему не известны точные характеристики своих соперников (выигрыши, пространства стратегий). Например, рассмотрим конкуренцию фирм в области исследований и разработок. Динамическая игра, в которой участвуют фирмы, стремящиеся получить патент, является игрой с несовершенной информацией, если

фирмам неизвестны удельные затраты соперников на исследования (или квалификация их инженеров), но она является игрой с несовершенной информацией в том случае, если в данный момент времени фирмам неизвестно, сколько их соперники уже потратили на исследования и разработки. На самом деле это различие в чем-то семантическое; игра с несовершенной информацией может быть преобразована в игру с несовершенной информацией посредством введения нового игрока, «природы», который выбирает характеристику или тип каждого игрока, и затем предположения, что игроки, за исключением данного игрока, не обладают информацией о выборе типа этим игроком (см. [33]). ** Понятие равновесия, описанное в разделе 11.5, включает игры с неполной и с несовершенной информацией.

· * В частности, одновременную игру можно описать как игру с несовершенной информацией, исходя из предположения, что один игрок делает свой выбор раньше другого и что последнему неизвестна альтернатива, выбранная первой (см., например, игру 2).

** Предположим, что каждому игроку известны характеристики этого игрока, но что с точки зрения n – 1 других игроков эти характеристики случайны и распределены в соответствии с некоторым известным распределением вероятностей. Можно ввести игрока (n + 1), чья стратегия заключается в выборе характеристик для каждого из п первоначальных игроков в начале игры. Каждый игрок наблюдает только свои характеристики и, таким образом, располагает несовершенной информацией о выборе природой характеристик своих противников. Чтобы наделить природу функцией цели, можно предположить, что она безразлична ко всем выборам характеристик и что она рандомизирует согласно первоначальному распределению вероятностей.

Характеристика (или тип) ti игрока i отражает все, что необходимо для принятия игроком решения.* На практике нередко постулируется, что ti – некоторый параметр целевой функции игрока i (например, параметр затрат или спроса), известный игроку i. Далее предполагается как общеизвестное, что типы a priori реализуются в соответствии с некоторым распределением

p(t1,…, ti,…, tn).

Игрок i, таким образом, может определить условную вероятность

pi(t-i|ti)

на типах своих противников

t-i ≡(t1,…, ti-1, ti+1,…, tn).

если его тип ti задан.

* См. [8, 33, 44].

11.4.2. Статические игры с неполной информацией

В этом подразделе мы рассмотрим только те игры, в которых игроки делают ходы одновременно, и поэтому ни один игрок не имеет возможности отреагировать на ход другого. Следовательно, мы можем на некоторое время абстрагироваться от проблемы абсолютности, обсуждавшейся в разделе 11.3. Важно и то, что нам не нужно беспокоиться о выводах, сделанных игроками по поводу типов своих противников, так как все действия осуществляются до того, как их можно наблюдать. Следовательно, эти выводы не имеют последствий. Динамические игры с неполной (или несовершенной) информацией будут рассматриваться в разделе 11.5. (Отметим, что в динамической игре вопрос о выводах может оказаться важным.)

Мы предполагаем, что i-й игрок выбирает некоторую стратегию ai из Ai (как и раньше, Ai можно расширить, чтобы включить смешанные стратегии) и получает ex post выигрыш

Выбор стратегии i-м игроком, естественно, зависит от его информации ti. Обозначим этот выбор через aiti. Согласно Харшаньи, байесовское равновесие – естественное распространение равновесия по Нэшу на игры с неполной информацией. Оно предполагает, что каждый игрок i правильно предвосхищает стратегии, выбираемые всеми игроками. Так как эти действия зависят от типов, он корректно вычисляет функции.

Определение. Байесовское равновесие представляет собой набор условных типовых стратегий, , таких, что каждый игрок максимизирует свою ожидаемую полезность в зависимости от своего типа и принимая условные типовые стратегии других игроков заданными: максимизирует

Другими словами, игрок i ожидает, что игрок j выберет стратегию, если его тип – tj однако, не зная tj, первый должен вычислить свой ожидаемый выигрыш. Можно также представить, что игрок i имеет несколько воплощений, таких, как игрок i типа ti и другой игрок i типа. Реализация того, какое из воплощений играет против других игроков, производится в соответствии с априорным распределением. Таким образом, байесовское равновесие можно рассматривать как равновесие по Нэшу с игроками, где |Ti| число потенциальных типов i-го игрока.

Пример 1.

Начнем с понятного примера. В игре двух лиц с одновременными ходами (таблица 11.5) игрок 1 имеет только один тип (игрок 2 обладает полной информацией об игроке 1). У игрока 2 есть два возможных типа: t2 и. В то время как игрок 2 знает свой тип, игрок 1 придает равные вероятности обоим типам. У каждого игрока есть два возможных хода (вверх (U) или вниз (D) для игрока 1, вправо (К) или влево (L) для игрока 2). Каждая клетка представляет выигрыши игроков 1 и 2. Например, левая верхняя клетка говорит о том, что, если игрок 1 делает ход U, а игрок 2 имеет тип t2 и делает ход L, они получают 3 и 1 соответственно. Отметим, что выигрыш игрока 1 зависит только от выбранных стратегий, а не от того, кем является игрок 2. Нахождение байесовского равновесия здесь получается непосредственно. Каждый тип игрока 2 имеет доминирующую стратегию.

Таблица 11.5

Игра 4

Игрок 2

Игрок 1

Тип t2

Тип

L

R

L

R

U

D

3, 1

0, 1

2, 0

4, 0

3, 0

0, 0

2, 1

4, 1

Независимо от того, что делает игрок 1, t2 выбирает L, а выбирает R (т. е. и ). Теперь все обстоит так, как если бы игрок 1 столкнулся с противником, который делает ходы L и R с равной вероятностью, поскольку t2 и равновероятны. Таким образом, делая ход U (соответственно D), игрок 1 получает 1/2 (3+2) (соответственно 1/2 (0+4)). Следовательно, = U.

Пример 2.

Рассмотрим дуополию с (количественной) конкуренцией по Курно. Пусть прибыль i-й фирмы квадратична: Пi = qi(ti – qi – qj), где ti – разность между свободным членом кривой линейного спроса и постоянными удельными затратами i-й фирмы (i = 1,2), а 9; – количество, выбранное i-й фирмой (ai ≡ qi). Общеизвестно, что у фирмы 1 величина t1 = 1 (фирма 2 обладает полной информацией о фирме 1). Фирма 2, однако, имеет частную информацию о своих удельных затратах. Фирма 1 знает только то, что t2 = 3/4 или t2 = 5/4 с равными вероятностями. Таким образом, у фирмы 2 есть два потенциальных типа, которые мы будем называть «тип с низкими затратами» (t2 = 5/4) и «тип с высокими затратами» (t^ = 3/4). Обе фирмы выбирают свои объемы выпуска одновременно. Найдем равновесие в чистых стратегиях. Фирма 1 выбирает 9ь а фирма 2 выбирает (если t2 = 5/4) или (если t2 = 3/4). Начнем с фирмы 2:

где arg max – множество значений, на которых достигается максимум целевой функции. Теперь рассмотрим фирму 1, которая не знает, с каким типом она имеет дело:

где Е(•) – математическое ожидание по типам фирмы 2. Однако

Таким образом, получаем {q1 = 1/3, = 11/24, = 5/24} в качестве (вероятно, единственного) байесовского равновесия. Этот простой пример показывает, что можно вычислить байесовское равновесие как равновесие по Нэшу для игры трех лиц.*

* Более подробно об этой игре см. в [59]. Последовательную версию данной игры (т. е. версию Штакельберга) см. в разделе 11.6.

Пример 3.

Предположим, что два игрока одновременно предлагают цену на некоторый неделимый товар (). Игрок, предложивший самую высокую цену, получает товар и платит свою предложенную цену. (Таким образом, если bi > bj, игрок i получает товар и платит bi продавцу. Если bi = bj, товар продается по общей цене случайным образом – спецификация аукциона в данном случае не имеет значения, так как одинаковые предложения цены будут иметь нулевую вероятность.) Тип игрока ti – оценка им товара; поэтому i-й игрок получает ti – bi, если он выигрывает, и 0, если проигрывает. Типы ti независимо и равномерно распределены на [0, 1]. Теперь найдем байесовское равновесие, при котором предложенная игроком цена – строго возрастающая и дифференцируемая функция его оценки товара. Так как игра симметричная, получим равновесные симметричные стратегии: b = b*(t). Выигрыш i-го игрока, если он относится к типу t и предлагает цену b, имеет следующий вид:

Пi = (t – b) Prob{bj < b},

где – Prob обозначает «вероятность того, что». Так как стратегии строго возрастающие,

Рrоb{bj < b} = Prob{bj ≤ b}.

Но в силу стратегии j-го игрока

Prob{ bj < b } = Prob{b*(tj) < b} = Prob{tj < (b) ≡ Ф(b)} = Ф(b),

где Ф(b) – обратная функция b* (словом, Ф(b) – оценка j-го игрока, когда он предлагает цену b) и используется равномерное распределение типов (если θ распределено равномерно на [0, 1] и k [0,1], тогда Prob{ θ ≤ k} = k). Таким образом, i-й игрок максимизирует

Пi = (t – b)Ф(b),

что дает условие первого порядка

– Ф(b) + (t – b)Ф'(b) = 0.

Теперь, для того чтобы b"(·) также было оптимальной стратегией i-го игрока, последний должен быть типа t = Ф(b) при предложении цены b. Следовательно,

Ф(b) = [Ф(b) – b]Ф'(b).

Это дифференциальное уравнение имеет очевидное решение Ф(b) = 2b. Таким образом, при байесовском равновесии каждый игрок назначает цену, равную половине своей оценки: b*(t) = t/2.* Аналогичные методы используются при решении игры «война на истощение». См. раздел 9.9.

· * Условие второго порядка выполняется для каждого участника аукциона. Более подробно об аукционах см. [47, 50]. О характеризации и единственности в аукционе первого предложения цены см. в [42].

Упражнение 11.10(**). Рассмотрим аукцион первого предложения с п участниками. Оценка каждого участника выбирается независимо в соответствии с интегральным распределением F(t) = tα на [0, 1]. Покажите, что в равновесии функция предлагаемой цены линейна по оценке участника аукциона. Что происходит, когда n стремится к бесконечности?

Упражнение 11.11(**). Предположим, что оценка ценности предмета участником аукциона влияет на оценки этого предмета другими участниками аукциона. Крайним случаем этой ситуации является аукцион с общей ценностью, на котором ex post ценность предмета (например, аренда нефтехимическая
промышленность" href="/text/category/himicheskaya_i_neftehimicheskaya_promishlennostmz/" rel="bookmark">нефтепромысла) одинакова для всех участников аукциона и каждый участник имеет частную несовершенную оценку общей ценности. Победа тогда приносит плохие известия победителю, который узнает, что другие участники аукциона придавали низкую ценность товару. Рациональный участник аукциона должен предвидеть проклятие победителя. Рассмотрите аукцион первого предложения для товара с общей ценностью θ = х1 + х2. Параметры х1 и х2 выбираются независимо в соответствии с равномерным распределением на [0, 1]. Имеются два участника аукциона, i = 1,2. Участник i знает xi, но не xj.

1. Докажите неформально, что выигрыш i-го участника аукциона, если он выиграет, неизбежно меньше xi + 1/2 – bi (где bi – выигрышное предложение цены).

2. Найдите симметричное равновесие. Пусть х = Ф(b) обозначает обратную функцию предложения цены. Докажите, что при данном х, величина bi(= Ф-1)) максимизирует

{xi + E[xj|xj ≤ Ф(bi)] – bi}Ф(bi)

3. Вычислите равновесную функцию предложения цены (указание: она линейна).

Пример 4.

Игры с полной информацией и одновременными ходами часто допускают равновесия в смешанных стратегиях. Некоторым исследователям это не нравится, так как, по их утверждению, «лица, принимающие решения в реальном мире, не подбрасывают монеты». Однако, как показал Харшаньи [34], равновесия в смешанных стратегиях для игр с полной информацией нередко можно обосновать как пределы равновесий в чистых стратегиях в играх с небольшим возмущением и неполной информацией. Действительно, мы уже отмечали, что в байесовской игре сразу после вычисления условных типовых стратегий игроков каждый игрок ведет себя так, будто он столкнулся со смешанными стратегиями своих противников. (Природа порождает неопределенность посредством выбора типов, а не выбора стороны монеты.) Чтобы проиллюстрировать механику такого построения, рассмотрим одношаговую версию игры «Выиграй доллар», представленную в таблице 11.6.

Таблица 11.6

Игра «Выиграй доллар»

Игрок 2

Игрок 1

1

N

1

N

-1, – 1

1, 0

1, 1

0, 0

У каждого игрока есть две возможные стратегии: инвестирование или отсутствие инвестирования. В версии игры с полной информацией фирма получает 1 (т. е. выигрывает), если лишь она инвестирует; теряет 1, если обе фирмы инвестируют, и остается при своих, если не инвестирует (мы можем рассматривать эту игру как крайне грубое представление рынка естественной монополии). Единственное симметричное равновесие предполагает смешанные стратегии: каждая фирма инвестирует с вероятностью 1/2. Ясно, что это состояние равновесия: каждая фирма зарабатывает 0, если она не инвестирует, и зарабатывает 1/2(1) + 1/2(-1) = 0, если инвестирует. Теперь рассмотрим эту же игру со следующей неполной информацией: структура выигрыша каждой фирмы отличается лишь тем, что в случае выигрыша фирма получает 1 +1, где t равномерно распределено на [–ε,+ ε]. Каждая фирма знает свой тип t, но не знает тип другой фирмы. Теперь легко видеть, что симметричные чистые стратегии – «a(t < 0) = не инвестировать, a(t ≥ 0) = инвестировать» – образуют байесовское равновесие. С точки зрения каждой фирмы другая – инвестирует с вероятностью 1/2. Таким образом, фирма должна инвестировать тогда и только тогда, когда 1/2(1 + t) + 1/2(-1) ≥ 0, т. е. t ≥ 0. Так как для данного типа у игрока есть единственная наилучшая стратегия, нет проблем с сопротивлением игрока предписанию смешивать с данной вероятностью (1/2). Когда ε стремится к нулю, байесовское равновесие в чистых стратегиях стремится к равновесию по Нэшу в смешанных стратегиях для игры с полной информацией.

Так как игры с полной информацией являются идеализацией (на практике каждый обладает хотя бы некоторой неполнотой информации о целях других игроков), утверждение Харшаньи показывает, что трудно привести веские доводы против равновесия в смешанных стратегиях на том основании, что они требуют механизма случайного выбора.*

· * Достаточные условия на целевые функции и информационную структуру, при которых предел байесовских равновесных стратегий, когда неопределенность становится «пренебрежимой», образовал бы равновесие по Нэшу предельной игры с полной информацией, см. в [48].

11.5. Совершенное байесовское равновесие

Теперь мы изучим динамические игры с неполной (или несовершенной) информацией. Сложность этих игр состоит в том, что игрок, отвечающий на ход другого игрока, может почерпнуть информацию из этого хода. Естественно предположить, что процесс выводов принимает форму байесовской корректировки на основе предполагаемой равновесной стратегии последнего игрока и его наблюдаемого хода. Понятие равновесия – это комбинация понятия абсолютного равновесия (подыгры) для динамических игр и понятия байесовского равновесия для игр с неполной информацией. Этот раздел вводит такое простейшее понятие, как совершенное байесовское равновесие (СВР),* и представляет четыре простых приложения этого понятия.

· * Уточнение этого понятия обсуждается в разделе 11.6.

Чтобы объяснить понятие равновесия, мы начнем с простой игры с неполной информацией, изображенной на рис. 11.5. В игре участвуют три игрока, она продолжается три «шага». На шаге 1 игрок 1 может выбирать из трех альтернатив – «левой» (L1), «средней» (M1) и «правой» (R1). Если игрок 1 выбирает одну из двух последних, игроку 2 остается выбирать между «левой» (L2) и «правой» (R2), хотя ему и неизвестен точный выбор игрока 1 (он знает лишь то, что игрок 1 не выбрал li). Несовершенная информация игрока 2 представлена информационным множеством {M1,R1}, характеризуемым овалом вокруг двух соответствующих узлов (n2 и n3). При такой информации игрок 2 сталкивается с одинаковым выбором в узлах n2 и п3. Наконец, при историях {M1,R2} или {R1,L2} игрок 3 должен выбирать между «левой» (L3) и «правой» (R3) альтернативами на третьем шаге, не зная, каких узлов (n4 или п5) достигла игра. Значения целевых функций записываются в нижней части дерева. Например, при ходах (М1,L2,R3) игрок 1 получает 3, игрок 2 – 2, а игрок 3 – 0.

Рис. 11.5. Игра 5.

Следующая притча должна помочь в понимании понятия равновесия. Предположим, что экономисту нужно решить игру 5, и, не зная, что делать, он обращается к двум людям, обладающим весьма специфическими талантами.

Первый консультант – специалист по теории игр. Он хорошо знает метод нахождения абсолютных равновесий динамических игр, описанных в разделе 11.3. С другой стороны, он достаточно хорошо знаком с теорией принятия решений, чтобы понять концепцию ожидаемой полезности (выигрыша). Однако он не знаком с законом Байеса для вычисления апостериорных распределений вероятностей. Взглянув на задачу, изображенную на рис. 11.5, он сначала пытается решить задачу принятия решения для игрока 3. К сожалению, он осознает, что может сформулировать эту проблему как классическую задачу принятия решения, если игрок 3 приписывает некоторую субъективную вероятность (скажем, μ3) нахождению игры в узле n5 (поэтому условная вероятность n5 равна 1 – μ). Точно так же проблема принятия решения для игрока 2 зависит от вероятности (μ2), которую он приписывает нахождению игры в узле n2. Тогда специалист по теории игр действует в научной манере. Допуская свое незнание вероятностей, приписанных каждому информационному множеству (здесь μ = (μ2, μ3)), он делает следующее замечание: «Если даны субъективные вероятности μ, игра идентична игре с полной информацией, которую я могу решить». На самом деле при данном μ3 игрок 3 выбирает стратегию, которая максимизирует его ожидаемый выигрыш. Игроку 2 известна оптимальная стратегия игрока 3, и он также максимизирует свою ожидаемую полезность при субъективной вероятности μ2. Наконец, при оптимальных стратегиях других игроков игрок 1 делает выбор в соответствии со своими интересами. Следовательно, специалист по теории игр сообщает экономисту о соответствии между субъективными вероятностями р, и оптимальными стратегиями, полученными обратной индукцией:

где может быть смешанной стратегией.

Второй консультант – специалист по байесовской статистике. Вычисление апостериорных распределений вероятностей – его вторая натура; однако он не знаком ни с теорией игр, ни с теорией принятия решений. Обладая научным складом ума, он делает следующее замечание: «Если дан набор стратегий а = {а1,а2,а3}, я могу вычислить вероятности, которые должны приписывать игроки различным узлам». Например, если игрок 1 выбирает каждую свою стратегию с вероятностью 1/3, то игрок 2 должен приписать вероятность μ2 = 1/2 узлу п2, если игра достигает его информационного множества. Более того, если а2 = R2, игрок 3 приписывает вероятность μ3 = 1 узлу n4. Что происходит, когда игрок 1 выбирает a1 = L1 (с вероятностью 1)? Тогда игрок 2 может приписать любую вероятность μ2 узлу n2, так как каждая вероятность совместима с законом Байеса (потому что событие «игра доходит до информационного множества игрока 2» имеет нулевую вероятность).* Статистик по каждому набору стратегий сообщает набор предположений, совместимых с этими стратегиями в байесовском смысле: μ Вау(а).

* Однако мы, следуя [39], можем потребовать, чтобы μ3 согласовывалось с μ2. К примеру, если μ2 = 1/2 и игрок 2 делает ход L2 с вероятностью 2/3, то μ3 = 1/3 (см. ниже].

Вывод из этого рассуждения легко угадать. Экономист приглашает к себе двух своих консультантов. Статистик предлагает, чтобы стратегии, которые он использует для вычисления вероятности, действительно были выбранными игроками стратегиями, которые ему должен предоставить специалист по теории игр. В свою очередь специалист по теории игр предлагает, чтобы субъективные вероятности игроков базировались на изучении поведения других игроков, и призывает статистика предоставить ему эти вероятности. Затем оба соглашаются, что понятие равновесия должно выявить эти два типа совместимости. Следовательно, они определяют совершенное байесовское равновесие как набор стратегий а, которые удовлетворяют

(11.1)

и связывают с этими стратегиями систему предположений, поддерживающих равновесие, полагая

(11.2)

Таким образом, оптимальные стратегии (и связанные с ними предположения) удовлетворяют условию неподвижной точки:

(Р) стратегии – это оптимальные заданные предположения;

(В) предполжения получаются из стратегий и наблюдаемых действий с помощью правила Байеса.

Понятие совершенного байесовского равновесия было введено в формальную литературу по теории игр Зельтеном [62] как «совершенное равновесие» и Крепсом и Уилсоном [39] как «последовательное равновесие».* Хотя Зельтен первым определил это понятие, Крепсу и Уилсону следует поставить в заслугу то, что они больше значения придали предполжениям,** сделали понятие более применимым и проложили путь для уточнений, основанных на ограничениях на предположения для событий с нулевой вероятностью (пример см. в разделе 11.6).

* Крепе и Уилсон показали, что совершенные и последовательные равновесия совпадают почти для всех игр.

** Зельтен определил свое понятие совершенного равновесия с «неуверенными игроками» для нормальной формы. Предположения, хотя их легко вычислить, скорее подразумеваемы, чем очевидны.

Замечание. Мы очень неформально подходили к тому, что означает байесовская корректировка. По крайней мере, информационным множествам, достигаемым с положительной вероятностью на равновесной траектории, необходимо приписывать предположения, согласующиеся с правилом Байеса. Это дает слабое определение СБР, которое совпадает с последовательным равновесием только в некоторых играх (например, игра с сигнализированием в разделе 11.6). Чтобы построить более сильную и приемлемую версию СБР, в более сложных играх должны быть добавлены дополнительные ограничения на совместимость предположений вне траектории равновесия. Требование совместимости Крепса и Уилсона (см. подраздел 11.6.1) – одно из таких ограничений.

Как мы вычисляем совершенное байесовское равновесие (или равновесия) в игре? Характеристика СБР как неподвижной точки соответствия подсказывает способ вычисления. Однако вычисление неподвижной точки крайне громоздко. Довольно часто интуитивное представление позволяет нам решить задачу непосредственно, если определение хорошо понято. Общего метода не существует, однако есть несколько систематических приемов, используемых при решении этих игр. Игра, изображенная на рис. 11.5, в действительности тривиальна. У игрока 3 есть доминирующая стратегия, которая состоит в применении хода Lз, поэтому независимо от μ3, aз = L3. Следовательно, мы можем преобразовать эту игру в двухшаговую игру двух лиц, представленную на рис. 11.6. (Так как игрок 3 не участвует в этой игре, мы опускаем и значения его целевой функции.)

Рис. 11.6. Игра 6.

Мы видим, что у игрока 2 существует доминирующая стратегия – L2. Поэтому оптимальная стратегия игрока 1 есть M1. Следовательно, единственное СБР имеет вид a = (M1, L2, L3), и оно связало с ним набор предположений (2 = 1, [0,1]).

Эта игра действительно тривиальна. В силу существования доминирующих стратегий специалист по теории игр находит равновесную траекторию без помощи статистика.

Теперь мы решим четыре простые, но нетривиальные игры, которые важны для теории организации промышленности. В этих играх (в противоположность предыдущей игре) имеет место взаимодействие между обратной индукцией и прямым байесовским выводом. Две первые – игры с неполной информацией, в которых информированная сторона может открыть информацию, выбирая между двумя стратегиями. В третьей игре частная информация игрока может быть раскрыта посредством сложного (двухмерного) поведения. Здесь простое экономическое рассуждение показывает, какой должна быть экономическая траектория. Четвертая игра дает пример игры с несовершенной информацией.

11.5.1. Двухшаговая игра с репутацией

Ниже представлена значительно упрощенная версия теории репутации Крепса–Уилсона–Милгрома–Робертса. Имеются две фирмы (i = 1,2). На первом шаге обе фирмы присутствуют на рынке. Единственная («укоренившаяся») фирма 1 выбирает стратегию a1. Пространство стратегий имеет два элемента: «нанесение ущерба» и «предоставление входа». Прибыль фирмы 2 («новичка») – D2, если фирма 1 предоставляет вход, и Р2, если фирма 1 наносит ущерб, так что D2 > 0 > Р2. Фирма 1 имеет один из двух потенциальных типов ti: «разумный» или «безумный». Будучи разумной, фирма 1 получает D1, когда предоставляет вход, и Р1, когда наносит ущерб, где D1 > Р1. Таким образом, разумная фирма предпочитает предоставлять вход, а не наносить ущерб. Однако больше всего она бы предпочла быть монополией: в таком случае она бы получала mi на каждом шаге, где M1 > D1. Будучи безумной, фирма 1 склонна к хищничеству и поэтому наносит ущерб (ее функция полезности такова, что нанесение ущерба всегда оправданно). Пусть p1 (соответственно 1 – p1) – априорная вероятность того, что фирма 1 разумна (соответственно безумна).

На втором шаге только фирма 2 выбирает стратегию а2. Эта стратегия может принимать одно из двух значений: «остаться» и «выйти». Если фирма остается, то получает выигрыш D2 если фирма 1 действительно разумна, и Р2, если фирма 1 безумна. Суть в том, что, если фирма 1 не безумна, она не будет применять хищническую стратегию на втором шаге, так как нет смысла создавать или поддерживать репутацию в конце. (Это предположение может быть получено более формально из описания конкуренции на втором шаге.) Разумная фирма 1 получает D1, если фирма 2 остается, и М1 > D1, если фирма 2 выходит. Пусть δ – коэффициент дисконтирования между двумя шагами.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26