Мы предполагали, что безумный тип всегда наносит ущерб. Тогда интересно изучить поведение разумного типа. Со статической точки зрения разумная фирма 1 захотела бы предоставить вход на первом шаге. Однако, нанося ущерб, она могла бы убедить фирму 2 в том, что она фирма безумного типа, тем самым стимулируя выход (так как Р2 < 0) и увеличивая свою прибыль на втором шаге.
Начнем с классификации потенциальных совершенных байесовских равновесий.
Разделяющее равновесие – это такое равновесие, при котором два типа фирмы 1 выбирают две различные стратегии на первом шаге. Здесь это означает, что разумный тип выбирает предоставление входа. При разделяющем равновесии фирма 2 обладает полной информацией на втором шаге: если μ –апостериорные предположения новичка на втором шаге по поводу типа укоренившейся фирмы, то
(t = разумный | предоставить вход) = 1
и
(t = безумный | нанести ущерб) = 1.
Объединяющее равновесие – это такое равновесие, при котором два типа фирмы 1 выбирают одинаковую стратегию на первом шаге. Здесь это означает, что разумный тип наносит ущерб. При объединяющем равновесии фирма 2 не корректирует свои предположения, наблюдая равновесную стратегию:
(t – разумный нанести ущерб) = р1.
Могут также существовать и смешанные, или полуразделяющие, равновесия. Например, в игре с репутацией разумный тип может смешивать выбор между нанесением ущерба и предоставлением входа (т. е. между объединением и разделением). Тогда имеем
(t = разумный нанести ущерб) (0,p1)
и
(t = разумный предоставить вход) = 1.
Сначала найдем условия существования разделяющего равновесия. При таком равновесии разумная фирма 1 предоставляет вход и, таким образом, раскрывает свой тип и получает D1(1 + δ). (Фирма 2 остается на рынке, так как она ожидает D2 > 0 на следующем шаге.) Если бы фирма 1 решила нанести ущерб, она убедила бы фирму 2 в своем безумии и получила бы Р1 + δM1. Таким образом, необходимым условием для существования разделяющего равновесия является
δ(M1 – D1) < (D1 – Р
Наоборот, предположим, что условие (11.3) выполнено. Рассмотрим следующие стратегии и предположения: разумная укоренившаяся фирма предоставляет вход, а новичок (правильно) предвосхищает, что она разумна, когда наблюдает предоставление входа; безумная укоренившаяся фирма преследует, а новичок (правильно) предвосхищает, что она безумна, когда наблюдает хищничество. Ясно, что эти стратегии и предположения образуют разделяющее СВР.
Рассмотрим теперь возможность существования объединяющего равновесия. Оба типа наносят ущерб; поэтому, как мы видели, = р1, когда наблюдается хищничество. Теперь разумный тип, который теряет D1 – P1 на первом шаге, должен стимулировать выход (по крайней мере, с достаточной вероятностью). Поэтому ситуация должна быть такой, чтобы
p1D2 + (1 – p1)P2 ≤
И наоборот, допустим, что условие (11.4) выполняется, и рассмотрим следующие стратегии и предположения: оба типа наносят ущерб и новичок имеет апостериорные предположения = р1, когда наблюдается хищничество, и = 1, когда наблюдается предоставление входа. Прибыль разумного типа при равновесии равна Р1 + δМ1; она бы стала D1(l + δ) в случае предоставления входа. Таким образом, если нарушается условие (11.3), предложенные стратегии и предположения образуют объединяющее СВР. (Если условие (11.4) выполняется при равенстве, то существует не одно равновесие, а континуум таких равновесий). Если нарушаются условия (11.3) и (11.4), то единственным равновесием является смешанное СВР (причем новичок рандомизирует, когда наблюдает хищничество).
Следующее упражнение распространяет этот анализ на п шагов.
Упражнение 11.12(***).
1. Зельтен [63] построил следующий парадокс. Сеть магазинов (укоренившаяся фирма) расположена на п географически разделенных рынках. Она сталкивается с п потенциальными новичками, одним на каждом рынке. Потенциальные новички должны принимать свои решения о входе последовательно. В момент i (i = 1,...,n) i-й новичок, который наблюдал происходящее на предыдущих i – 1 рынках, решает входить (I-вход) или не входить (О – воздержание от входа). Если он входит, укоренившаяся фирма выбирает либо нанесение ущерба (Р), либо молчаливое согласие (А); выигрыши на i-м рынке такие, как показано на рис. 11.7 (первый выигрыш относится к укоренившейся фирме, второй – к i-му новичку). Решения о входе и нанесении ущерба на i-м рынке наблюдаются до принятия новичком i + 1 решения о том, стоит ли ему входить. Выигрыш укоренившейся фирмы равен сумме ее n выигрышей. Покажите, что при одном потенциальном новичке (n = 1) единственное абсолютное равновесие требует, чтобы новичок вошел, а укоренившаяся фирма молча согласилась. Затем продемонстрируйте парадокс Зельтена с сетью магазинов: неважно, сколь велико n, все новички входят, а укоренившаяся фирма никогда не наносит ущерб.
2. Теперь вместе с Крепсом, Милгромом, Робертсом и Уилсоном предположим, что новичку неизвестна целевая функция укоренившейся фирмы. С вероятностью 1 – х выигрыши такие, как указано выше; с вероятностью х укоренившаяся фирма получает, скажем, 1/2 вместо – 1, когда наносит ущерб (в остальных отношениях выигрыши неизменны). Решите пример с одним новичком. Затем с помощью обратной индукции получите равновесие для i-го новичка при апостериорных предположениях xi в начале i-го шага. Насколько большими должны быть х1 = х, чтобы удержать новичка 1 за пределами рынка?
Рис. 11.7.
11.5.2. Последовательные переговоры при неполной информации
Переговоры обычно связаны с асимметричной информацией. Например, продавец (соответственно покупатель) может обладать неполной информацией о готовности покупателя платить (соответственно об отправной цене продавца). В той мере, в какой переговоры проходят через ряд предложений, отказов, контрпредложений и т. д., будет естественным моделировать их как динамическую игру с неполной информацией. Здесь приведен простой пример такой формализации. (Непосредственная интерпретация такой игры применялась при формализации межвременной ценовой дискриминации монополистом в главе 1.)
Рассмотрим следующую простую задачу о переговорах. Покупатель и про-даьец ведут переговоры об одной единице продукта (или о контракте). Продавец делает первоначальное предложение р1, которое покупатель либо принимает, либо отклоняет. Если предложение отклонено, продавец делает второе предложение, р2. Если отвергнуто и второе предложение, то стороны расходятся, а продукт остается у продавца. Ценность продукта – s для продавца и b для покупателя. (Ценность должна быть интерпретирована в широком смысле, включая возможность внешнего обмена с другими сторонами.) Предположим, что коэффициент дисконтирования
– δs для продавца и δb для покупателя и что обе стороны нейтральны к риску. Следовательно, функции полезности продавца и покупателя – [р1, b – р1], если р1 принимается, [δsp2, δb(b – p2)], если р2 принимается, и [δss,0], если р2 отвергается. Неполная информация сводится к следующему: продавец не знает, какова ценность продукта для покупателя – или b (b < ). Продавец приписывает равные вероятности обеим ценностям, тогда как покупателю известно Ь. Все остальное известно обеим сторонам. Предположим, что всегда существует некоторая потенциальная выгода от обмена: s < b < . Более того, предположим, что b > (+ s)/2. Из этого условия следует, что, если бы продавец был уполномочен делать только одно предложение, он бы предпочел продать наверняка (назначив b), вместо того чтобы рисковать потерей продажи (пытаясь продать по цене ). Определим теперь стратегии и предположения. Сначала продавец делает предложение р1. Покупатель принимает предложение (d1 = 1) или отвергает (dj = 0) в зависимости от pi и готовности заплатить. Таким образом, стратегию покупателя можно обозначить через di(pi, b). Если покупатель отвергает р1 продавец выводит из этого апостериорную вероятность того, что готовность покупателя платить равна, которую мы обозначим через μ(|pi). Очевидно, fi(b|pi) = 1 –μ(|pi). Продавец тогда делает следующее предложение – p2(p1) – Наконец покупатель принимает p2(d2 = 1) или отвергает p2(d2 = 0) в соответствии с решающим правилом d2(р1, p2, b). (При равновесии p1 не будет аргументом d2.)
1. Первый шаг состоит в записи «ограничений на самоотбор», которым должна удовлетворять равновесная траектория. Под ограничениями на самоотбор мы подразумеваем (в достаточно общем виде) ограничения, отражающие то обстоятельство, что при равновесии игрок данного типа не строго предпочитает принять какую-либо стратегию, кроме своей (такую, как стратегия этого же игрока, когда он имеет другой тип). Здесь у покупателя могут быть два типа – b и. Покупателя, который придает продукту ценность b (соответственно ), мы называем «покупателем типа b» (соответственно «типа »). На втором шаге ограничения на самоотбор тривиальны: покупатель типа b покупает тогда и только тогда, когда р2 ≤ b. Аналогично покупатель типа b примет предложение р1 на первом шаге тогда и только тогда, когда
b – p1 ≥ δb{max[b – p2(p1),0]}. (11.5)
Уравнение (11.5) отражает следующее: если покупатель принимает предложение p1, его полезность составляет b–p1, a если отвергает, то продавец назначает p2(p1)
Запись уравнения (11.5) для b и показывает, что если покупатель типа b принимает р1, то a fortiori покупатель типа b принимает р1 (просто потому, что он придает продукту большую ценность, чем покупатель типа b, и поэтому более склонен покупать).
2. Второй шаг состоит в рассмотрении следствий ограничений на самоотбор для апостериорного распределения вероятностей продавца на b. Ясно, мы можем предположить, что pi было отвергнуто (в противном случае переговоры завершаются и распределение не имеет больше значения). Так как предложение, принятое покупателем типа b, автоматически принимается покупателем типа, то вероятность встречи с покупателем последнего типа, когда предложение отвергнуто, равна, самое большее, 1/2.
3. Третий шаг состоит в возвращении к пространству стратегий посредством исследования влияния этого распределения на стратегию продавца во втором шаге. Когда продавец может сделать только одно предложение и его распределение на b равномерно, он ведет себя осторожно в силу предположения (т. е. он назначает b). A fortiori, когда его субъективная вероятность встречи с покупателем меньше 1/2, он также должен вести себя осторожно; поэтому независимо от р1 мы имеем р2(р1) = b. Теперь два последних шага характеризации равновесия очевидны.
4. Покупатель типа b, предвидя, что продавец назначит b, если он отвергнет первое предложение, принимает его тогда и только тогда, когда р1 ≤ b. Покупатель принимает р1 тогда и только тогда, когда – р1 ≥δb( – b), или, проще говря,
Р1 ≤ – δbb + (1 – δb) .
5. Наконец, продавец выбирает p1 для максимизации ожидаемой прибыли. Он выбирает между b и в зависимости от того, больше или меньше b, чем
Если он предлагает b, это предложение принимается покупателями обоих типов. С другой стороны, если он предлагает, то получает выгоду от нетерпения покупателя, хорошо зная, что он сможет включиться в обмен на втором шаге, если покупатель окажется покупателем типа b. Так как в нашем описании мы определили стратегии и предположения игроков для каждой предыстории игры, мы делаем вывод, что игра имеет единственное совершенное байесовское равновесие.
Более общий анализ этой модели, включая случай, где покупатель также обладает неполной информацией о ценности продукта для продавца, можно найти в [23].
11.5.3. Гарантия как сигнал качества
Покупатель готов приобрести единицу продукта неопределенного качества (например, подержанную машину). Точнее, вероятность того, что продукт будет исправно работать, равна П, а того, что окажется неисправным, – (1 – П). Продавцу известно П, поэтому П – его «тип». Покупатель знает, что П принадлежит интервалу [П,], и имеет первоначальное распределение вероятностей, определенное на этом интервале. Покупатель получает полезность, если не покупает у этого продавца (например, – получаемая им полезность, если он не потребляет продукт; альтернативно – отправная полезность покупателя, связанная с его готовностью платить за поиск среди других продавцов). Пусть I1 – валовая денежная ценность работающего продукта, а I2 – валовая денежная ценность неработающего продукта (I1 > I2). Продавец предлагает контракт (р, g), где р – цена продукта, а д – выплата компенсации, если продукт не работает. Полезность для потребителя равна и(I1 – р) в первом случае и u(I2 – р + g) во втором; предполагается, что функция полезности для покупателя, потребляющего продукт, строго вогнута. Продавец, который, по нашему предположению, нейтрален к риску, имеет ожидаемую прибыль р – (1 – П)g, если покупатель соглашается на контракт (р, д). Продавец и покупатель встречаются только один раз, что исключает проблему репутации товара. Какой контракт предложит продавец? На экономическом уровне интуитивное представление, основанное на теории страхования, приводит к следующим положениям.
1. В случае полной информации (т. е. покупатель знает П) все оптимумы Парето таковы, что покупатель полностью застрахован. Другими словами, эта гарантия всегда задает g0 = I1 – I2.
2. В случае неполной информации, если продавец предлагает выплату компенсации до, полезность для покупателя не зависит от его субъективного распределения вероятностей на П, когда он потребляет продукт. Поэтому он принимает любую цену, не превышающую р0, где р0 определяется уравнением
u(I1 – p0) = и(I2 – р0 + g0) = .
(Для упрощения анализа предположим, что р0 – (1 – П)g0 > 0.) Когда продавец предлагает с0 = (р0,g0). покупатель получает нулевой излишек для любого П.
3. Контракт с0 Парето-оптимален для любого П.* С другой стороны, продавец предложил бы некоторый другой контракт с = (р, д), если бы он ожидал получить прибыль большую, чем при c0. Так как любой другой контракт субоптимален, покупатель получит отрицательный излишек от такого обмена, и поэтому ему не следует делать покупку. Другими словами, рациональный покупатель должен недоверчиво относиться к продавцу, если тот не предлагает полной гарантии.
* Покупатель получает полное страхование при со, поэтому ему безразлично истинное значение П.
В двухшаговой игре мы формализуем наше интуитивное представление о том, что в равновесии продавец предлагает контракт c0. Сначала продавец предлагает контракт с = (р, g), зависящий только от его информации, т. е. с(П). Затем покупатель выбирает: купить (d(c) = 1) или не купить (d(c) = 0). Его поведение зависит от его предположений относительно П, точнее, от ожидаемого П при априорном распределении вероятностей на П и информации в контракте, предложенном продавцом, с = (р, g). Пусть μ(с) – это апостериорное ожидание. В совершенном байесовском равновесии с(П) максимизирует ожидаемую прибыль продавца с объективной вероятностью П, и при заданном d(·). μ(с) совместимо с функцией с(·) в смысле Байеса, a d(c) максимизирует ожидаемую полезность покупателя при заданном μ(с).
Предположим, что продавец, имеющий машину с вероятностью работоспособности П, предлагает контракт с = (р, д), отличающийся от с0 = (р0,д0). Так как d(c0) = 1, ожидаемая прибыль продавца для с должна удовлетворять
р – (1 – П) g > р0 – (1 – П)g0. (11.7)
Это неравенство должно выполняться для всех значений П, при которых продавец выбирает с. Так как μ(c) является (согласно закону Байеса) средней взвешенной этих значений, имеем
р – [1 – μ(с)]g > р0 – [1 – μ(с)]g0. (11.8)
С другой стороны, излишек покупателя неотрицателен (в противном случае он бы не сделал покупку и контракт не был бы оптимальным для покупателя). Следовательно,
Μ(с)u(I1 – р) + [1 – μ (с)] u (I2 – р + g) ≥ = u(I1 – р
Используя неравенство Йенсена (если f(x) строго вогнута, то f(Ex) > Ef(x), где оператор математического ожидания относится к х) , получаем
(И. Ю)
Легко видеть, что (11.8) и (11.10) противоречат друг другу (g0 = I1 – I2).
Раз мы заметили, что для любого П равновесное предложение, принимаемое покупателем, должно быть c0, то нам не составит труда построить СВР, которое порождает эту равновесную траекторию. Любой контракт с, отличный от c0, должен иметь в равновесии нулевую вероятность. Поэтому мы можем свободно выбирать предположения (когда μ(c0) является с необходимостью ожиданием П для априорного распределения при заданных объединении и правиле Байеса). Достаточно предположить, что покупатель убежден в том, что такой контракт предлагает «худший» продавец (продавец с наименьшей вероятностью П). Поэтому если продавец предлагает контракт с = (р, g), то покупатель его принимает тогда и только тогда, когда
Однако из этого неравенства ясно, что ожидаемая прибыль продавца меньше, чем если бы он предложил с0.*
* Рассмотренная выше концепция возникла при дискуссии, последовавшей после публикации статьи Спенса о восприятии потребителями качества продукта. Наше обсуждение следует [30]. См. также [46].
11.5.4. Подавление сигнала
Каждый из трех предыдущих примеров включал игрока с частной информацией, который пытался манипулировать предположениями другой стороны по поводу этой информации. Четвертый пример показывает, как можно манипулировать предположениями при несовершенной (но не неполной) информации. В этом примере игрок, выбирая ненаблюдаемое действие, искажает важную для выигрыша информацию, полученную другим игроком.
Простейшая модель включает две фирмы, две стратегии, два типа, два уровня прибыли и два шага. Фирмы 1 и 2 конкурируют на первом шаге. У фирмы 1 есть две возможные стратегии: S (мягкая; предоставление входа) и Т (жесткая; нанесение ущерба). Стратегия фирмы 2 здесь не описана (можно считать, что она всегда предоставляет вход). Фирма 1 имеет полную информацию о своем выигрыше. При одном шаге она предпочитает разыграть S. Разыгрывание Т стоит с > 0. Это общеизвестно. У фирмы 2 есть два потенциальных уровня прибыли: H и L при H > 0 > L. Априорное распределение полагает вес а величине Н и 1 – α величине L, если фирма 1 выберет S. (Таким образом, имеются два «типа» – H и L; терминология здесь нарушается, так как мы будем предполагать, что фирма 2 не знает своего типа.) Однако если фирма 1 выбирает Т, фирма 2 получает прибыль L независимо от ее типа. Фирма 2 не наблюдает, какой выбор сделала фирма 1 на первом шаге: S или Т, и не знает его типа. Вместо этого она должна сделать вывод о его типе на основе наблюдения за своей прибылью и своих ожиданий относительно того, какой выбор сделала фирма 1. За исключением выбора стратегии фирмы 1, обе фирмы обладают одинаковой информацией. На втором шаге фирма 2 решает, стоит ли ей оставаться. Прибыли одинаковы на этих двух шагах (если обе фирмы остаются на рынке и фирма 1 выбирает такую же стратегию). Фирма 1, которая, по нашему предположению, всегда прибыльна, остается и выбирает стратегию S (так как это последний шаг, фирма 1 применяет свою доминирующую стратегию в одинаковой игре). Дисконтированный доход второго шага для фирмы 1 от превращения в монополию составляет g > с. (Для простоты предположим, что д и с не зависят от типа фирмы 2, хотя это и несущественно.) Фирма 2 получает нулевую прибыль на втором шаге, если она покидает рынок.*
· * Эта игра с подавлением сигнала – упрощение игры из [24]. Другие игры с подавлением сигнала можно найти в [28, 35, 56].
Чтобы найти равновесие, рассмотрим две возможные стратегии для фирмы 1 на первом шаге. Во-первых, предположим, что она выбирает S в равновесии. Прибыль фирмы 2 на первом шаге идентична ее прибыли на втором шаге и поэтому содержит полную информацию о ней. Таким образом, фирма 2 остается тогда и только тогда, когда она получает прибыль H на первом шаге. Теперь S должна быть равновесной стратегией: игра Т не увеличивает прибыль фирмы 1. Выбирая Т на первом шаге, фирма 1 проигрывает с, но выигрывает g, если ей удается изменить решение фирмы 2 остаться. Это происходит, когда у фирмы 2 тип H. Выбор Т дает фирме 2 прибыль L, и эта фирма, думая, что фирма 1 выбрала S, покидает рынок. Таким образом, необходимое условие для того, чтобы S была равновесной стратегией, имеет вид:
(11-11)
И наоборот, если условие (11.11) выполняется, выбор S фирмой 1 и применение фирмой 2 правила выхода – «выходить тогда и только тогда, когда прибыль на первом шаге равна L» – образуют совершенное байесовское равновесие.
Во-вторых, предположим, что Т – равновесная стратегия. Тогда прибыль равна L, каким бы ни был тип фирмы 2: прибыль на первом шаге неинформативна. Поэтому при наблюдении L апостериорные предположения такие же, как и априорные. При наблюдении L фирма 2 остается тогда и только тогда, когда
. (11.12)
Если условие (11.12) выполняется, Т не может быть равновесной стратегией. Фирма 1 могла бы сэкономить с без изменения прибыли на втором шаге. Если условие (11.12) не выполняется, выбор Т является равновесной стратегией, когда затраты на такой выбор с меньше выигрыша (если фирма 1 отклоняется и выбирает S, фирма 2 уходит тогда и только тогда, когда она относится к типу с низкой прибылью). Поэтому Т – равновесная стратегия тогда и только тогда, когда нарушаются оба условия – (11.11) и (11.12).
Когда условие (11.11) нарушается, а (11.12) выполняется, то, как мы уже знаем, равновесие в чистых стратегиях не существует. Следовательно, если равновесие существует (на самом деле мы знаем, что оно существует, – см. раздел 11.6), то оно должно подразумевать, что фирма 1 смешивает S и Т. Предположим, что фирма 1 выбирает Т с вероятностью у (и S с вероятностью 1 – у) и что фирма 2, наблюдая прибыль L, уходит с рынка с вероятностью z (остается с вероятностью 1 – z). Чтобы фирма 1 смешивала, она должна быть безразличной к обоим действиям; следовательно,
(11.13)
(Выбор Т изменяет решение фирмы 2 только тогда, когда она имеет тип H, и это решение меняется лишь с вероятностью z.) Так как условие (11.11) нарушается, условие (11.13) определяет единственное z в (0, 1). Далее, чтобы фирме 2 было безразлично уходить или оставаться при наблюдении L, ситуация должна быть такой, чтобы
где – апостериорная вероятность того, что фирма 2 имеет тип H. Согласно правилу Байеса,
(Когда истинный тип – H (соответственно L), вероятность закончить игру с прибылью L равна вероятности у хищничества (соответственно 1)). Таким образом, нам необходимо
(11-14)
Так как условие (11.12) выполняется, условие (11.14) определяет единственное у в (0.1]. Таким образом, мы делаем вывод, что в этой игре существует единственное равновесие.
Эти четыре игры были выбраны за их простоту. В частности, каждая из них имеет единственное равновесие. Часто, однако, динамические игры с неполной или несовершенной информацией страдают множественностью равновесий. Это вызвано, в частности, тем, что закон Байеса не работает, когда наблюдаемый ход имеет нулевую вероятность.* Определенная свобода конкретизации гипотез при таких событиях может вызвать большое число равновесий. Дополнительный раздел приводит примеры множественных равновесий и показывает, как можно выбирать из них, используя уточнения совершенного байесовского равновесия.
* В игре с хищничеством безумный тип всегда наносит ущерб; поэтому «нанесение ущерба» – событие с положительной вероятностью (правило Байеса применимо); «предоставление входа» всегда сигнализирует о разумном типе. Таким образом, свободы не существует. Точно так же в игре с переговорами: «отказ» – событие с положительной вероятностью в интересной области для ценовых предложений (цены, превышающие b, которые отклоняются типом b). Особенность игры с гарантией состоит в том, что набор стратегий, оптимальный по Парето (который определяет равновесие при полной информации), один и тот же для всех типов. В игре с подавлением сигнала ход укоренившейся фирмы непосредственно не наблюдается.
11.6. Дополнительный раздел
11.6.1. Существование равновесия
Основной результат существования решения касается существования равновесия по Нэшу. Существование байесовского, абсолютного и совершенного байесовского равновесий доказывается посредством других простых интерпретаций этого результата. Рассмотрим игру в нормальной форме с конечным числом игроков (i = 1, ...,n). Пусть Ai – набор возможных стратегий i-го игрока, а – (ai, ... ,аi,... , аn) – вектор стратегий (где а, принадлежит Ai), a Пi (а) – выигрыш i-го игрока. Следующая теорема – частный случай теоремы, содержащейся в [16]. (Дебре также допускает, что набор возможных стратегий игрока зависит от стратегий других игроков.)
Теорема. Если Ai – компактное выпуклое подмножество евклидова пространства для всех i, а Пi непрерывно по а и квазивогнуто по ai, то существует равновесие по Нэшу, т. е. такой вектор а*, что для всех i и ai из
.
Эта теорема (которую можно доказать методом неподвижной точки) имеет непосредственное приложение к играм с конечным числом стратегий. Она показывает, что для таких игр равновесие всегда существует в смешанных стратегиях (оно не обязательно существует в чистых стратегиях – см., например, игру со сравнением монет). Пусть – множество распределений вероятностей на конечном множестве чистых стратегий Ai. Таким образом, мы расширяем множество стратегий, чтобы допустить смешанные стратегии: гомеоморфно симплексу и, следовательно, компактно и выпукло. Функция IP становится математическим ожиданием на исходах чистых стратегий; поэтому она линейна (следовательно, квазивогнута) по ai и является многочленом (следовательно, непрерывна) по а. Итак, всегда существует равновесие в смешанных стратегиях [53].
Приведенная выше теорема (или ее варианты) дает также условия существования равновесия в играх с континуумом стратегий. Однако некоторые игры в организации промышленности (например, аукционы, конкуренция Курно, игры с размещением) имеют разрывные и/или квазивогнутые функции выигрыша. Достаточные условия для существования равновесия в чистых стратегиях (с квазивогнутыми функциями выигрыша) и равновесия в смешанных стратегиях (без квазивогнутости) см. в [13, 14].
Теорему можно также использовать, чтобы доказать существование равновесия для версий концепции по Нэшу в случае неполной информации или динамики. Предположим, что у каждого игрока есть только конечное число возможных чистых стратегий. Точно так же при неполной информации у каждого игрока i есть только конечное число потенциальных типов |Тi| (т. е. природа имеет только конечное число чистых стратегий).
11.6.1.1. Существование байесовского равновесия
Достаточно трансформировать игру n лиц в игру лиц. Это означает, что у каждого игрока есть |Ti| воплощений, преследующих свой собственный интерес. (Игрок i, имея тип ti, не заботится о выигрыше, который он бы получил, если бы имел тип.) Это по-прежнему игра с конечным числом участников и конечным числом чистых стратегий. Следовательно, она допускает существование равновесия в смешанных стратегиях. Ясно, что равновесные стратегии в трансформированной игре являются равновесными стратегиями исходной игры.
11.6.1.2. Существование абсолютного равновесия
Для игр с полной информацией алгоритм обратной индукции Куна дает конструктивное доказательство существования абсолютного равновесия. В более общем случае существование абсолютного равновесия проистекает из общего доказательства для совершенного байесовского равновесия (хотя для игр с почти полной информацией существуют более простые доказательства).
11.6.1.3. Существование совершенного байесовского равновесия
Совершенное равновесие с «неуверенными игроками» [62] – более детализированное понятие, чем последовательное равновесие Крепса и Уилсона [39], которое в свою очередь более детализировано, чем совершенное байесовское равновесие; поэтому оно дает существование СБР и последовательного равновесия как побочные результаты.
Рассмотрим нормальную форму игры. При заданном множестве стратегий Аi для игрокаiг мы можем определить множество вполне смешанных стратегий для этого игрока:
.
Это означает, что, вероятность выбора ai игроком i, должна быть строго положительной.
Зафиксируем ε и обозначим через, множество чисел, таких что 0 < ε (al) < ε для всех ai. Теперь рассмотрим следующую задачу максимизации для игрока i:
при условии, что для всех ai, (11.15)
где – смешанные стратегии, применяемые другими игроками. Иными словами, игрок i вынужден применять каждую из своих возможных стратегий по крайней мере с малой вероятностью.
«ε - совершенное равновесие» – множество таких (вполне смешанных) стратегий, что для некоторых, при 0 < ε(ai) < ε, σi решает задачу (11.15) для каждого игрока i. Другими словами, ε - совершенное равновесие – это равновесие по Нэшу в игре с ограничениями. Для заданных { ε (аi)} такое равновесие по Нэшу, согласно теореме Дебре, существует. (Единственное отличие от доказательства существования равновесия в смешанных стратегиях в том, что смешанные стратегии должны принадлежать подмножествам симплексов; однако это не имеет существенного значения, поскольку подмножества компактны и выпуклы.)
Совершенным равновесием с «неуверенными игроками» является любой предел ε - совершенного равновесия, когда ε стремится к нулю. Так как пространства стратегий компактны, такой предел существует (всегда существует сходящаяся подпоследовательность). Поскольку функции прибыли Пi непрерывны, любой предел является равновесием по Нэшу (из условия 11.15).
Замечание 1. Когда игрок делает ход на различных информационных множествах, это понятие равновесия перестает быть недостаточно детализированным. Зельтен вводит второе уточнение, которое работает подобно первому, но на так называемой нормальной форме с агентами. (Нормальная форма с агентами состоит в рассмотрении каждого информационного множества как отдельного игрока с целевой функцией того игрока, чьим воплощением она является. Это определяет нормальную форму с большим количеством игроков, к которой можно применить рассмотренные выше методы. Отличие от предыдущего подхода в основном то, что колебания игрока в разных информационных множествах должны быть независимыми, поэтому существует меньшее число равновесий с «неуверенными игроками». Понятие равновесия с «неуверенными игроками» в действительности относится к этому второму уточнению.) Обсуждение см. в [26].
Замечание 2. Суть в том, что совершенное равновесие с «неуверенными игроками» – это не только равновесие по Нэшу, но также и СВР. В этом случае оправдывает себя прием Зельтена – введение колебаний. Игра с возмущениями при необходимых минимальных колебаниях не содержит выбора стереотипа с нулевой вероятностью. Следовательно, в развернутой форме (с нормальной формой, определенной приведенной выше игрой) нет события с нулевой вероятностью. Правило Байеса действует повсюду, и равновесия по Нэшу автоматически удовлетворяют требованию совершенства. (Чтобы представить это, вернемся к игре 1. Если игрок 1 вынужден выбрать R, по крайней мере, с вероятностью ε (R) > 0, игрок 2 неизбежно концентрирует максимальный вес на стратегии r, следующей за R. Следовательно, l не будет пределом оптимальных реакций на R, даже если ε(R) стремится к нулю. Для нормальной формы игры 1 построение Зельтена дает только единственное совершенное равновесие.) Таким образом, не заслуживающие доверия угрозы не входят ни в состав равновесия по Нэшу в игре с возмущениями, ни в состав совершенного равновесия с «неуверенными игроками» в пределе.
Замечание 3. В отличие от Зельтена, исследовавшего игры в нормальной форме, Крепе и Уилсон [39] использовали развернутую форму, в большей мере акцентируя на предположениях в информационных множествах. Они рассматривают совершенные байесовские равновесия (СВР), удовлетворяющие требованию совместимости. Это означает, что множество стратегий и предположений при СВР должно быть пределом такой последовательности множеств стратегий и предположений, что эти стратегии вполне смешаны и предположения совместимы со стратегиями и правилом Байеса. Вдоль этой сходящейся последовательности стратегии не обязательно оптимальны при данных предположениях даже в зельтеновском ограничительном смысле. Они должны быть оптимальны лишь в пределе. Легко видеть, что в сигнальной игре, изучаемой в подразделе 11.6.2.1, этот критерий совместимости не выполняется. Однако в более общих играх он (среди прочего) предписывает совместимость предположений различных игроков или одного и того же игрока на различных информационных множествах, даже при событиях с нулевой вероятностью. Крепc и Уилсон показали, что «почти для всех игр» последовательные равновесия и совершенные равновесия с «неуверенными игроками» совпадают.
11.6.2. Уточнения
Проблема, которую мы усиленно избегали в тексте, это общая и значительная множественность равновесий в динамических играх с неполной или несовершенной информацией. Чтобы понять, почему этот вопрос часто возникает, рассмотрим игру, в которой игрок 1 имеет частную информацию и первым делает ход, а игрок 2, которого интересует информация игрока 1, отвечает на его выбор. (Такая игра будет называться ниже сигнальной игрой.) Предположим, что мы хотим исключить некоторую стратегию а1 как равновесную стратегию для игрока 1. Для этого предположим, что gi фактически не оптимально для игрока 1 (это означает, что а\ имеет «нулевую вероятность в равновесии», т. е. составляет «внеравновесную траекторию» или «внеравновесное событие»). В этом случае правило Байеса не выполняется и допустимы любые предположения относительно типа игрока 1 после отклонения на а1. Во многих играх существуют такие типы для игрока 1, что если бы они были общеизвестны, то побудили бы игрока 2 сделать ход, который причинил бы значительный ущерб игроку 1. Например, если игрок 2 полагает, что игрок 1 имеет высокие предельные затраты или что спрос высок, то он войдет на рынок или накопит большую мощность. Теперь, если мы определим, что после наблюдения а1 игрок 2 полагает, что игрок 1 имеет такой тип, на который игрок 2 действительно делает ход, ухудшающий состояние игрока 1, тогда в конечном счете игрок 1 не захочет сделать ход a1. Свобода в определении предположений, лежащих на внеравновесной траектории, порождает некоторую свободу в ьыборе равновесных стратегий; посредством исключения некоторых потенциально равновесных стратегий можно трансформировать другие стратегии в равновесные. Поэтому неудивительно, что мы нередко заканчиваем с континуумом совершенных байесовских равновесий.
Но множественность, как обычно, порождает сомнения по поводу самой природы равновесия. Как игроки координируют на определенном равновесии? Выбирают ли они «фокальное» равновесие? Обучаются ли они? Если да, то каков процесс обучения? Многие из последних разработок в теории игр связаны с уточнением понятия равновесия посредством наложения ограничений на события, лежащие на внеравновесной траектории, где правило Байеса не налагает ограничений. В нашем распоряжении теперь находится около дюжины уточнений совершенного байесовского равновесия. Хотя данная область быстро изменяется и эти замечания скоро устареют, мы рассмотрим два таких уточнения, которые часто использовались и просты в применении.*
* Более полное обсуждение уточнений см. в [10, 26] и в библиографии этих двух статей.
Подраздел 11.6.2.1 (см. [26]) описывает простейшую игру, в которой возникают вопросы корректировки и совершенства, – сигнальную игру. Из-за сложности динамических игр с неполной информацией экономисты в области организации промышленности получили много (возможно, слишком много) приложений этой базисной игры. Мы рассмотрим, как применить два уточнения в этой игре. В подразделе 11.6.2.2 решены примеры.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |


