Основное интуитивное представление Крепса и соавторов [49] состоит в том, что небольшая неопределенность в отношении предпочтений игроков (технически – в отношении вышеприведенной матрицы выигрышей) может оказывать значительное влияние на поведение игроков, если игра повторяется достаточно долго (но она не обязательно должна повторяться бесконечное число раз). Чтобы убедиться в этом, предположим, что каждый игрок с вероятностью 1 – α «разумен», т. е. его выигрыш задан матрицей выигрышей в таблице 6.2 (так что, например, выигрыш при (F, C) равен 4 для игрока 1). В то же время каждый игрок с вероятностью α «безумен». Его предпочтения не представлены предшествующей матрицей выигрышей; скорее всего, он поступает следующим образом. В момент 1 он начинает сотрудничать. В момент t он продолжает сотрудничать, если до этого момента сотрудничал его оппонент; в противном случае он предает. (Этот безумный тип может рассматриваться как олицетворение предпочтения в отношении сотрудничества или отвращения к предательству, которое сочетается с сильным желанием наказать отказавшегося от сотрудничества оппонента). «Безумие» не отражает ценностное суждение, но относится к поведению (или предпочтению), которое отклоняется от нормы (ассоциируемой с предпочтениями, определенными матрицей выигрышей). Можно считать α малой, если предполагается, что безумие относительно маловероятно.

Теперь ненадолго возвратимся к нашей метафоре, согласно которой фирма может выбрать одну из двух цен (сотрудничество соответствует назначению высокой цены, а предательство – низкой). Здесь можно было бы рассмотреть «разумный тип» как столкновение с низкими производственными затратами (и, следовательно, получение выгоды от безответного снижения цен), а «безумный тип» как столкновение с достаточно высокими затратами (скажем, выше низкой цены), которые не окупаются снижением высокой цены соперника.* **

* При такой интерпретации а не обязательно должна быть мала.

** В данном виде эта метафора несовершенна в том отношении, что фирма с низкими затратами должна назначать низкую цену после отклонения. Причина, по которой «дилемма заключенного» полезна при построении некоторого интуитивного предположения о ценовой игре, будет приведена в главе 9.

Предположим, что игра повторяется от t = 0 до t = Т, и примем для упрощения вычислений, что коэффициент дисконтирования
δ = 1. Каждый игрок знает свои предпочтения («разумные» или «безумные»), но не знает предпочтений оппонента. Поскольку безумное поведение мы определили, теперь мы получим стратегию игрока i, исходя из предположения, что от разумен.

Допустим, что игрок 1 в момент 0 предает (стратегия F). Поскольку безумный игрок никогда не возьмет на себя инициативу предать первым, игрок 1 должен быть разумным. Предательство обоих игроков с момента 1 и далее (до конца игры) составляет равновесие. По самому определению безумия, игрок 2, если он безумен, мстит за уклонение от сотрудничества в момент 0. Если он разумен, он вполне мог бы предать, если игрок 1 предаст – неважно почему. Точно так же игрок 1, который разумен, не может сделать ничего лучшего, кроме как предать. Фактически это составляет единственное равновесие с момента 1 и далее* после уклонения от сотрудничества в момент 0. Это означает, что если игрок 1 разумен и предает в момент 0, его выигрыш составляет самое большее 4 (он получает самое большее 4 в момент t = 0 и 0 в моменты 1,... ,Т). Рассмотрим теперь стратегию, которая заключается в сотрудничестве игрока 1 до момента Т, если игрок 2 не уклоняется от сотрудничества в некоторый момент t, в случае чего игрок 1 предает от момента t + 1 до Т. Такая стратегия не должна быть (и фактически не является) оптимальной для игрока 1, если он разумен; тем не менее, как мы сейчас покажем, она доминирует предательство в момент 0 при достаточно большом Т, и поэтому предательство в момент 0 не может быть оптимальным даже для разумного игрока. Если игрок 2 безумен, то игрок 1 получает 3(Т + 1) от этой стратегии. Если игрок 2 разумен, игрок 1 получает в худшем случае 1, так как он продолжает сотрудничать, в то время как оппонент предает по крайней мере на одном шаге, после чего он играет бескоалиционно. Следовательно, выигрыш игрока 1 от такой стратегии составляет по меньшей мере

α [3(T + 1)] + (1 – α )( –1) > 4

для достаточно большого Т. Однако при любом малом значении α существует такое Т0, что при Т ≥ Т0 предательство в момент 0 не может быть оптимальным для игрока 1, даже если он разумен, точно так же, как и для игрока 2. Это означает, что при достаточно большой продолжительности каждый игрок сначала сотрудничает, даже когда с недальновидной (статической) точки зрения предательство является доминирующей стратегией для разумного игрока. В общем случае сотрудничество обоих игроков наблюдается, когда t ≤ Т – Т0.**

* В момент Т каждый из игроков предает (разумные игроки поступают так потому, что предательство – доминирующая стратегия последнего шага; безумный игрок 2 поступает так потому, что он мстит за отклонение на нулевом шаге), то же самое происходит в момент Т – 1 и в любой момент t ≥ 1 по обратной индукции.

НЕ нашли? Не то? Что вы ищете?

* Если оптимальная стратегия обоих типов игроков состоит в сотрудничестве в момент 0, ...,t – 1, то каждый игрок сохраняет априорные предположения, заданные посредством (1 – α,α) в момент t, если до этих пор оба игрока сотрудничали.

Интуитивное представление этого результата очевидно. Каждый игрок, сотрудничая, подвергает себя риску в том отношении, что другой игрок предаст, а сам он будет получать низкую прибыль на одном шаге (получив такой урок, он уже не будет стремиться к сотрудничеству). Тем не менее благодаря предательству он обнаруживает, что не относится к коалиционному (безумному) типу и, следовательно, теряет будущие выгоды от сотрудничества, если другой игрок относится к коалиционному типу. Если продолжительность достаточно велика, потери от будущего сотрудничества будут превышать потери от обмана. На начальной стадии своих взаимоотношений игроки хотят сохранить репутацию предположительно склонных к сотрудничеству игроков; иными словами, они не хотят проявлять свое нежелание сотрудничать.

Поскольку мы уже получили основной результат (возможность поддержания сотрудничества в течение достаточно больших периодов времени даже при малой вероятности безумия), мы не даем полного описания равновесия этой игры. Разумный игрок сотрудничает в течение некоторого промежутка времени. Затем, ближе к концу игры, он начинает извлекать выгоду из своей репутации; потеря от будущего сотрудничества становится сопоставимой с потерей от обмана. Следовательно, сговор распадется в конце взаимоотношений (если, по крайней мере, один из игроков не склонен к сотрудничеству).*

* Равновесие и его вывод формально аналогичны модели репутации монополиста по качеству. См. Дополнительный раздел к главе 2.

6.5.2. Обсуждение

Замечательной особенностью модели, приведенной в подразделе 6.5.1, является сильное влияние небольшой неопределенности относительно целевой функции каждого игрока на равновесное поведение, если продолжительность достаточно велика и если игроки не слишком нетерпеливы. Как показывают Крепе и соавторы [49], сотрудничество может поддерживаться при небольшой вероятности α безумия, хотя это и невозможно при α = 0.

Безусловно, возможность поддержания сговора или иного исхода зависит от типа безумия, которое мы склонны допустить. Если, например, допустить, что безумный игрок склонен сотрудничать несмотря ни на что (т. е. если он не «жаждет мести», после того как оппонент обманет его), сговор не будет поддерживаться ни при какой α.* Предательство не повлечет будущих потерь от сотрудничества с безумным игроком, и, следовательно, ничто не удержит разумного игрока от предательства.

* По обратной индукции предательство является «доминирующей» стратегией для разумного типа на каждом шаге. Таким образом, разумные игроки придерживаются стратегии F на каждом шаге, а не только в конце игры.

С другой стороны, Крепе и соавторы показывают, что (коалиционный) вывод подраздела 6.5.1 сохраняет силу, если безумие означает применение стратегии мести «зуб за зуб». (Стратегия мести «зуб за зуб» состоит в том, чтобы сотрудничать в момент 0, а затем делать то, что сделал другой игрок на предыдущем ходе.)

Высокая чувствительность равновесного поведения к представлениям о цели оппонента при большей продолжительности и высоком коэффициенте дисконтирования ставит вопрос о размере множества равновесий, порожденных малыми количествами, но произвольными характеристиками «безумия». Фью-денберг и Мэскин [42] показывают, что некоторая разновидность народной теоремы выполняется, т. е. «любой исход» может поддерживаться как равновесие достаточно продолжительной и слабо дисконтированной игры при неполной информации, если мы склонны присваивать вероятность α > 0 тому, что каждый из игроков безумен по-своему (подробнее см. в подразделе 6.7.3). Тогда множество равновесий будет таким же, как и для бесконечно повторяющейся игры (суперигры), но только между игроками разумного типа. Таким образом, мы вновь сталкиваемся с множеством затруднений. Есл подход суперигр заставляет нас делать выбор из большого множества равновесий одной модели, то подход репутации при большой продолжительности (который в силу конечной продолжительности существенно сокращает число равновесий данной модели) предлагает для выбора большое разнообразие моделей (описаний неопределенности) и соответствующих исходов.

Критическая статья Фьюденберга–Мэскина предлагает два подхода, которые могут придать прогнозирующую способность модели репутации. Первый подход состоит в обоснованном доверии к той форме безумия, которая может возникнуть в действительности.* Второй подход более согласуется с общим неоклассическим подходом, предполагающим полную рациональность (в смысле максимизирующего прибыль поведения) для получения прогнозирующей способности. Согласно этому подходу, каждый игрок считает оппонента рациональным и сам рационален; однако он не знает некоторых параметров, таких как предельные затраты оппонента или оценка спроса (см. приведенную выше метафору). Наряду с применением аксиомы рациональности преимущество этого подхода состоит в том, что он учитывает тип асимметричной информации, которая, вероятнее всего, велика (по сравнению с вероятностью безумия, которая, по нашему предположению, мала). (Равновесия динамических игр с неполной информацией имеют тенденцию к снижению чувствительности к точному определению «неопределенности», когда величина неопределенности не является пренебрежимо малой.) В главе 9 мы обычно будем использовать второй подход.

* Интересный результат, полученный Фьюденбергом и Ливайном [40], заключается в том, что при некоторых условиях информированному игроку за длительное время удается убедить соперников в том, что он «безумен» и что его форма безумия является «предпочтительным» безумием для (разумного) информированного игрока. Неформально этот предпочтительный тип безумия есть то безумие, которое в одношаговой игре побуждает соперника предпринять действие, наиболее благоприятное для информированного игрока разумного типа. Условия таковы, что информированный игрок – это игрок, который в течение длительного времени сталкивается с (длинной) последовательностью краткосрочных игроков (например, игроков, каждый из которых играет лишь на одном шаге), что краткосрочные игроки наблюдали прошлое поведение этого игрока и что они установили положительную априорную вероятность для предпочтительного типа безумия. В основе этого результата лежит интуитивное представление о том, что если информированный игрок очень терпелив и продолжительность очень велика, то затраты времени и потери, связанные с формированием наилучшей возможной репутации, оправдывают себя. Однако временной интервал, необходимый для создания такой репутации, продолжительнее, чем при подходе [49], где безумие может принять только одну форму и оппонентам не надо проводить различие между различными типами безумия.

Тем не менее нужно отметить, что подход, представленный в подразделе 6.5.1, обоснован многими экспериментами, которые показывают, что сговор, вероятно, может поддерживаться в длительных, но конечных играх. Например, Аксельрод [13] предложил «дилемму заключенного» (такую, какая была проиллюстрирована в разделе 6.4) специалистам по применению теории игр в области экономики, психологии, социологии, политологии и математики. Предполагалось, что игра повторяется Т = 200 раз. Далее Аксельрод проверил стратегии, предложенные специалистами по теории игр, сопоставляя их между собой в круговом турнире. Самую высокую оценку в среднем получила стратегия мести «зуб за зуб», а не «рациональная» стратегия предательства в каждом периоде.

Эти эксперименты указывают на следующие представления: при таких обстоятельствах второй подход, вероятнее всего, не сможет объяснить сговор, так как в отличие от ситуаций в организации промышленности здесь нет асимметричной информации о затратах, спросе и т. д. Если предположить, что предпочтения каждого участника возрастают от конечного благосостояния, то реальной асимметрии в информации о выигрышах участников не существует. Таким образом, неудачную попытку получить предательство (F) на каждом шаге можно, по-видимому, отнести на счет аксиомы рациональности. И действительно, логично предположить, что по крайней мере небольшая часть участников («безумные» игроки) не выполнила умозаключение по обратной индуйции, которое дает предательство на каждом шаге, либо они не могут его выполнить, либо полагают, что с некоторой вероятностью некоторые другие участники не выполнили этот расчет. Важный вклад подхода Крепса и его соавторов в том, что если игра повторяется достаточно длительное время, то даже у разумного игрока, выполнившего все необходимые расчеты, может возникнуть желание поступить подобно безумному игроку, и это принесет ему лучшие результаты, чем доносительство.

6.5.3. Эволюционный подход

Подход, основанный на репутации (подраздел 6.5.1), опирается на малую вероятность безумия. Но он не полностью отмежевывается от рационального подхода в том смысле, что большая часть участников пытается максимизировать общий выигрыш. Эволюционный подход вообще не требует максимизирующего поведения. Однако он признает, что, во-первых, экономические агенты не могут длительное время использовать абсолютно субоптимальные правила (так как они заметят это или же исчезнут)* и, во-вторых, допущение всех видов иррациональности влечет полную утрату прогнозирующей способности. Этот подход, который в духе Дарвиновой традиции впервые был разработан (в числе прочих) в [7, 46, 59] в области экономики и в [53, 54] в области биологии, рассматривает стратегии, или (если использовать лучшую терминологию) правила, которые «устойчивы» в том смысле, что они относительно хороши против множества других правил.** Например, Аксельрод [14] отмечает, что в повторяющейся игре «дилемма заключенного» стратегия «зуб за зуб» является устойчивым правилом, оно приводится в действие предательством оппонента, но после совершения ответного действия принимает форму снисходительности. (Напротив, правило «всегда предавать» запрещает получение выгод от сотрудничества с коалиционными типами, как было показано в подразделе 6.5.2, поскольку правило «всегда предавать после отклонения» недостаточно снисходительно в случае «ошибки».)***

* Например, в результате банкротства, если существует достаточная степень экспериментирования или мутации.

** Необходимо упомянуть также и последние публикации о повторяющихся играх автоматов (например, [6, 12, 48]).

*** Другое преимущество стратегии «зуб за зуб» в эволюционном контексте (когда успешные стратегии выживают и развиваются) состоит в том, что она допускает выживание других кооперативных стратегий (таких, как «всегда сотрудничать»). Для общего знакомства с подходом Аксельрода к сотрудничеству см. его книгу «Эволюция сотрудничества» [15] и обзор Милгрома [55].

Эволюционный подход предполагает, что при большой продолжительности игры остаются только те участники, которые используют устойчивые правила. Те участники, которые используют неустойчивые правила, умрут (в биологическом смысле), либо разорятся (в экономическом смысле), либо они будут экспериментировать с новыми правилами; более удачливые участники увидят, что их правилами руководствуются следующие поколения:

«Биологическое обоснование этого подхода базируется на интерпретации выигрышей с точки зрения приспособляемости (выживаемости и плодовитости). Все мутации возможны, и если бы какая-либо мутация могла захватить данную популяцию, то она получила бы возможность сделать это. Таким образом, предполагается, что только коллективно устойчивая стратегия способна длительное время обеспечивать свое равновесие в качестве стратегии, применяемой всеми. Коллективно устойчивые стратегии важны потому, что, если мутации начинаются в любой момент при большой продолжительности, вся популяция может придерживаться только их» [15, р. 310]. Остается определить прогнозирующую способность эволюционной теории. Так называемое «устойчивое правило» a priori зависит от множества и распределений вероятности мутаций, а также от множества стратегий, с которым можно сопоставить устойчивое правило.*

* В отечественной литературе такое «устойчивое правило» называется эволюцией – но устойчивой стратегией. – Прим. ред.

6.6. Заключительные замечания

Аналитические динамические модели повторяющегося ценового взаимодействия сложны, однако они обеспечивают наилучший подход к формализации тайного сговора. Теория игр дисциплинирует, заставляя экономиста размышлять о стратегической ситуации и точно ее описывать (включая в данном случае частоту и выбор времени ценовых изменений, структуру информации). В принципе, эта дисциплина позволяет лучше оценить состоятельность моделей; мало кто поверит в модель лишь потому, что она формализует общепринятые представления (тайный сговор при высокой рыночной концентрации; ломаная кривая спроса; ценовая секретность как препятствующий фактор и т. д.). В отсутствие убедительных эконометричеких данных о прогнозирующей способности различных моделей ценную информацию можно извлечь из анализа степени соответствия самой формы конкуренции, предлагаемой моделью («развернутой формой» игры), а не только ее исхода (например, равновесных цен или прибылей) неформальным описаниям в деловой прессе и ситуационным исследованиям отрасли.

Почему мы должны обратить внимание на три (или более) подхода к ценовому сговору? С точки зрения циника, отсутствие строгих проверок затрудняет отклонение подхода как несостоятельного. Но здесь, возможно, требуется «теоретическое разнообразие». Как отмечено во Введении, большое многообразие моделей поведения в различных отраслях может оправдать количественный рост теорий. Таким образом, подходы, рассмотренные в данной главе, и другие подходы могут дополнять друг друга, а не конкурировать.

Это приводит нас к трем важным вопросам «сравнительного моделирования», которые лишь частично были затронуты в этой главе и в литературе. Как можно проверить различные подходы? Какой из них является наиболее приемлемым в конкретной отрасли? Дают ли они различные стратегические выводы? Эти трудные вопросы должны получить приоритет в программе исследований.

6.7. Дополнительный раздел: Динамические игры и тайный сговор

6.7.1. Тайные снижения цены

6.7.1.1. Ценовая конкуренция

Для формализации интуитивного предположения, выдвинутого в подразделе 6.3.3, мы построим непосредственную модель тайного сговора в условиях неполной наблюдаемости цен. Поскольку модель Грина–Портера является специальной в том смысле, что она рассматривает количественную конкуренцию и поэтому допускает присутствие аукциониста (если мы всерьез принимаем это информационное допущение), мы отойдем от нее, предполагая прямую ценовую конкуренцию.* Таким образом, мы сделаем предположение Стиглера [80] о том, что фирмы не наблюдают цены своих соперников непосредственно, но делают выводы о них (несовершенно) по размерам спроса на свою продукцию. Тем не менее анализ следует духу модели Грина–Портера.

* Тот факт, что разные типы конкуренции имеют различное информационное содержание, имеет более общее значение. Милгром [56], например, подчеркивает, что сговор легче поддерживать для бесконечно повторяющихся «понижающихся» аукционов, чем для бесконечно повторяющихся закрытых аукционов. Предположим, например, что две фирмы, имея одинаковые затраты с по поставке покупателю, назначают цены. При закрытом аукционе они назначают цены одновременно. При понижающемся аукционе цена самопроизвольно снижается, пока одна из фирм не уступит; в этом случае другая фирма будет осуществлять поставку по текущей цене. При одном аукционе или при конечном их числе равновесием обоих типов аукционов является конкурентная цена (покупатель платит с). Повторяющийся закрытый аукцион имеет сходство с повторяющейся ценовой игрой, изученной в разделе 6.3. Сговор может поддерживаться, только если продолжительность бесконечна и коэффициент дисконтирования достаточно высок. В повторяющихся понижающихся аукционах отклонение замечается мгновенно (а не на один шаг позднее) и, таким образом, может быть неприбыльным даже со статической точки зрения (соперник отклонившегося может отказаться от уступки, пока цена текущего аукциона не станет равна с). Сговор возможен при любом коэффициенте дисконтирования. Организация рынка влияет, таким образом, на лаги обнаружения и на объем возможного сговора.

Структура игры та же, что и структура основной суперигры. Две фирмы выбирают цены на каждом шаге. Их товары являются совершенными заменителями и производятся при постоянных предельных затратах с, поэтому все потребители покупают товар у фирмы с низкой ценой. Величина спроса делится пополам, если фирмы назначают одинаковую цену. На каждом шаге существуют два возможных состояния природы. С вероятностью а на продукцию, продаваемую дуополистами, не существует спроса («состояние низкого спроса»). С вероятностью (1 – α) существует положительный спрос D(p) («состояние высокого спроса»). Монопольная цена и монопольные прибыли в состоянии высокого спроса обозначены через рт и Пm. Предположим, что реализации спроса независимо и одинаково распределены во времени.

Фирма, которая не продает товар в некоторый момент, не может определить, чем обусловлено отсутствие спроса – реализацией состояния низкого спроса или более низкой ценой соперника. Принято считать, что по крайней мере одна фирма не получает прибыли. Если это происходит вследствие отсутствия спроса, ни одна из фирм не получает прибыли. Если это происходит вследствие того, что одна из фирм снижает монопольную цену, она знает, что другая фирма не получает прибыли.

Функция спроса «все или ничего» явно нереалистическая. Однако она позволяет фирмам рассмотреть нетривиальную проблему выделения сигнала: фирма не может утверждать наверняка, является низкий спрос следствием снижения цены соперником или нет. Таким образом, модель соответствует подходу Стиглера (при общих функциях спроса на дифференцированные продукты фирма не может сделать точный вывод о снижении цены).

В неповторяющейся игре или в игре, повторяющейся конечное число раз, обе фирмы назначают конкурентную цену с (исход Бертрана). В бесконечно повторяющейся версии игры мы рассматриваем равновесие со следующими стратегиями: существуют фаза сговора и фаза наказания. Игра начинается в фазе сговора. Обе фирмы назначают цену рт до тех пор, пока одна из них не получит нулевую прибыль (как было отмечено выше, такое событие наблюдают обе фирмы, даже если одна фирма не наблюдает прибыли соперника).* Появление нулевой прибыли открывает фазу наказания. Обе фирмы назначают цену на уровне с в течение Т шагов, где Т a priori может быть конечно или бесконечно. По окончании (если оно наступает) фазы наказания фирмы возвращаются в фазу сговора и назначают цену рт, если они обе получают положительную прибыль.

* Эта модель имеет такое же важное свойство, как и ее аналог с полной информацией, т. е. нет причин для фирм пытаться назначить цену ниже рт (в противоположность количественной модели Грина–Портера – см. упражнение 6.9).

Теперь рассмотрим такую продолжительность фазы наказания, при которой ожидаемая настоящая дисконтированная ценность прибыли каждой фирмы максимальна при том ограничении, что соответствующие стратегии образуют равновесие.

В фазе наказания стратегии всегда оптимальны. Если соперник назначает конкурентную цену, неважно какую, в течение Т шагов, ни одна фирма не может сама улучшить эту конкурентную цену.

Пусть V+ (соответственно V –) обозначает настоящую дисконтированную ценность прибыли фирмы с момента t и далее, исходя из предположения, что в момент t игра находится в фазе сговора (соответственно, вступает в фазу наказания). В силу стационарности V+ и V – не зависят от времени. По определению, имеем

V+ = (1 – α) + α(δV –) (6.10)

и

V – = δTV+ (6.11)

Равенство (6.10) говорит, что в фазе сговора обе фирмы назначают цену рт. С вероятностью 1 – α спрос высок, каждая фирма получает текущую прибыль Пm/2, и игра остается в фазе сговора, так что обе фирмы вновь имеют оценку V+ на следующем шаге. С вероятностью а сегодня спрос отсутствует, и завтра игра вступит в фазу наказания. Равенство (6.11) дает настоящую дисконтированную ценность прибыли в начале фазы наказания. В течение Т шагов обе фирмы получают нулевую прибыль, после чего они возвращаются в фазу сговора.

Наконец, мы должны добавить «ограничение по стимулам», согласно которому ни одна из фирм не хочет снижать цену в фазе сговора:

V+ ≥ (1 – α)(Пm + δV –) + α (δV –

Это неравенство выражает компромисс для каждой фирмы. Если фирма снижает цену, она получает Пm > Пm/2. Однако снижение цены автоматически приводит к фазе наказания, которая дает V – вместо V+ (эти эффекты имеют место только при высоком спросе; если же спрос низкий, ничто не изменяется). Таким образом, чтобы ограничить снижение цены, V – должно быть достаточно меньше V+. Это означает, что наказание должно длиться достаточно долго. Но так как наказание влечет значительные затраты и наступает с положительной вероятностью, Т должно быть выбрано максимально малым при условии, что неравенство (6.12) должно выполняться. Математически неравенство (6.12) эквивалентно (с использованием (6.10)) следующему:

Δ(V+ – V –) ≥ (6.13)

С другой стороны, уравнения (6.10) и (6.11) дают

(6.14)

и

(6.15)

Подстановка (6.14) и (6.15) в уравнение (6.13) после некоторых вычислений дает

1 ≤ 2(1 – α) δ + (2 α – 1) δT+l. (6.16)

Так как игра начинается в фазе сговора, максимальная прибыль для фирм достигается решением следующей задачи:

max V+

при ограничении (6.16).

С помощью уравнения (6.14) нетрудно проверить, что V+ – убывающая функция Т, т. е. более длительные наказания сокращают ожидаемую прибыль. Поэтому мы должны выбрать минимально возможное Т в соответствии с уравнением (6.16). (Тот факт, что равенство (6.16) не выполняется при Т = 0, подтверждает наше замечание: требуются ощутимые наказания.) Правая часть неравенства (6.16) возрастает с Т тогда и только тогда, когда α < 1/2. Таким образом, при α > 1/2 не существует Т, удовлетворяющего неравенству (6.16). На интуитивном уровне это означает, что соблазн снизить цену возрастает, когда снижаются ожидаемые выгоды от будущего сговора. Если α < 1/2, правая часть (6.16) будет максимальна при Т = +∞.

Предположение, что (1 – α)δ ≥ 1/2, гарантирует, что высокая цена будет поддерживаться с помощью максимальных наказаний (Т = + ∞). Это предположение обобщает условие детерминированного спроса, которое соответствует условию α = 0 (см. раздел 6.3).

Чтобы максимизировать V+ с учетом ограничения по стимулам (6.16), достаточно выбрать наименьшее Т, которое удовлетворяет данному ограничению по стимулам. Таким образом, мы получаем оптимальную (конечную) длительность наказания.*

* Оставшийся вопрос состоит в том, что корень уравнения (6.16) может и не быть целым числом. Тогда можно взять самое малое целое число, превышающее этот корень, или (лучше) использовать рандомизирующий механизм, чтобы определить, отражает ли продолжительность наказания это целое число или максимальное целое число меньше корня (где вероятности выбираются так, чтобы ограничение (6.16) было активным).

Упражнение 6.8(**). Дайте свою интерпретацию модели Грина–Портера с ценовой конкуренцией и двумя независимо и одинаково распределенными состояниями спроса (отсутствие спроса или положительный спрос). Еще раз найдите оптимальную длительность фазы наказания. Покажите, что при вероятности отсутствия спроса α = 1/4 величина δ должна превышать 2/3, чтобы сговор мог поддерживаться. Покажите также, что необходимы, по крайней мере, два периода наказания.

6.7.1.2. Количественная конкуренция

Упражнение 6.9(***). Рассмотрим модель Грина–Портера с количеством как переменной выбора. Предположим, что рыночная цена в момент t составляет

pt = θtP(q1t + q2t),

где θt – независимо и равномерно распределенный мультипликативный шок спроса в момент t, распределенный в соответствии с функцией текущего спроса F. Фирма i наблюдает только pt, но не θt или qjt. Пусть

обозначает ожидаемую попериодную прибыль, когда обе фирмы производят q, и пусть qc – симметричный выпуск Курно (который, по нашему предположению, является единственным). Таким образом, qс максимизирует

.

Предположим, что ценовая война начинается, когда pt падает ниже некоторого порогового уровня р+. Таким образом, если qi и qj – выпуски фирм, вероятность возникновения ценовой войны будет

Пусть q+ и qc – выпуски фирм в фазе сговора и в фазе наказания (q+ < qc). Следует обратить внимание на ограничение, согласно которому наказания должны иметь вид Курно.

1. Используя те же обозначения, что и в тексте, покажите, что

где α – α(q+,q+).

2. Опять используя те же обозначения, покажите, что оптимальный выпуск q+ , триггерная цена р+ и длительность наказания Т получаются из решения задачи

при ограничении

(Оптимальное Т может быть конечным или бесконечным.)

3. Используйте интуитивное рассуждение для доказательства того, что q+ > qm, где qm максимизирует ожидаемое (θP(2q) – c)q. (Указание: объясните в терминах эффектов первого и второго порядка, начиная с q+ = qm.) Покажите, что q+ сходится к qm, когда величина шума стремится к нулю (распределение в становится вырожденным).

Равновесие Грина – Портера (описанное в упражнении 6.9) оптимально в ограниченном классе стратегий. Во-первых, наказания сведены к наказаниям Курно, тогда как существуют худшие наказания (некоторое интуитивное представление об этом можно получить из раздела 6.7). Во-вторых, ценовая война базируется на «хвостовом критерии». Она инициируется ценой pt, которая ниже порогового уровня р+, поэтому реальный уровень pt за пределами ее сопоставления с р+ не используется. Таким образом, данная модель предполагает частные формы фазы сговора и фазы наказания. Эбрю и соавторы [4, 5] рассматривают оптимальные стратегии сговора без ограничений на класс стратегий. Два предположения, позволяющие этим авторам получить очень свежие результаты, состоят в том, что целевые функции фирм вогнуты и что условное распределение рыночной цены pt при данном общем выпуске Qt удовлетворяет свойству монотонного отношения правдоподобия (monotone likelihood ratio property, MLRP). Неформально последнее условие означает, что низкое значение pt является следствием скорее высокого Qt, чем низкого.*

* Аналогичные применения этого условия см. в Дополнительном разделе главы, посвященной теории фирмы. Формально пусть F(pt|Qt) – условное интегральное распределение цены при совокупном выпуске с плотностью f(pt|Qt). Оно удовлетворяет MLRP, если

Эбрю и соавторы показали, что в действительности можно ограничиться рассмотрением фаз сговора и наказания, которые характеризуются выигрышами V+ и V –, где V+ и V – теперь составляют наилучший и наихудший элементы в множестве симметричных абсолютно равновесных выигрышей. Более того, фаза сговора и фаза наказания принимают простые формы. В фазе сговора фирмы производят выпуск q+. Фаза наказания инициируется хвостовым критерием, т. е. начинается, если рыночная цена падает ниже некоторого порогового уровня р+. Таким образом, фаза сговора имеет качественное сходство с моделью, предложенной Портером и Грином [44, 65]. Однако фаза наказания не имеет фиксированной длительности, хотя она сходна с фазой сговора. Каждая фирма производит (предположительно высокий) выпуск q– . Если рыночная цена превышает пороговую цену р–, игра остается в фазе наказания; если она ниже р– , то игра возвращается в фазу сговора. Таким образом, эволюция между двумя фазами следует марковскому процессу. Возможно, читателя удивит «обратный хвостовой критерий» фазы наказания. Дело в том, что строгое наказание требует высокого выпуска (даже выше индивидуально желаемого); для того чтобы гарантировать фирмам высокий выпуск, делается оговорка, что в случае высокой цены (которая сигнализирует о низком выпуске) игра остается в фазе наказания.*

* Если ограничить наказания видом Курно, то оптимальная длительность наказания составит Т = +∞ в силу вывода Эбрю–Пирса–Стачетти о самом строгом наказании V – . Это необходимо сопоставить с доказательством Портера [65] о том, что, если предыдущие предположения не выполняются, оптимальная длительность наказаний по Курно может быть конечной. Это также отличается от вышеприведенной ценовой игры, где наказания (по Бертрану) конечны. Ценовая игра и количественная игра технически различны; количественная игра демонстрирует в общем наблюдаемую переменную (рыночную цену), чего не происходит в ценовой игре.

6.7.2. Жесткости цен и ломаная кривая спроса

Ниже приведен технический анализ ценовой игры с чередующимися ходами, рассмотренной в разделе 6.4.

6.7.2.1. Критерий однопериодного отклонения

Читатель, возможно, будет озадачен утверждением в тексте, что для обеспечения оптимальности стратегий (R1, R2) недостаточно отклонения от равновесного поведения на одном шаге, даже если оно принесло прибыль; действительно, при расчете V1(p2) в момент t мы предположили, что фирма 1 будет реагировать в моменты t + 2, t + 4,... в соответствии с заданной функцией реакции R1(∙). Возможно ли, чтобы единичное отклонение от R1(∙) в момент t не было прибыльным, а последовательность отклонений от R1(∙) в моменты t, t + 2,... была прибыльной? Ответ отрицательный. (Последующее рассуждение применимо к более общим играм и, в частности, к супериграм, рассмотренным в разделе 6.3.) Сначала отметим, что конечная последовательность отклонений (от цены) в течение п шагов не может быть прибыльной для уклоняющейся фирмы, если одношаговое отклонение не прибыльно, ибо n-е отклонение не прибыльно, так как оно сводится к одношаговому отклонению. Таким образом, если фирма получает выгоду от п отклонений, она получает ее a fortiori от первых n–1 отклонений. Если мы исключим последнее отклонение, то (n – 1)-е отклонение станет одношаговым отклонением и, следовательно, не будет оптимальным, и т. д. Далее рассмотрим бесконечную прибыльную последовательность отклонений от R1(∙). Если она будет все время давать дополнительный выигрыш ε > 0 по отношению к постоянному следованию функции R1(∙), тогда (поскольку (δ < 1 влияет на то, что отдаленное будущее становится практически незначительным в терминах выигрышей) первые п отклонений сами дают дополнительный выигрыш ε' > 0 для достаточно больших п. Однако мы знаем, что конечные отклонения не дают такого выигрыша.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26