Макаров Данил Борисович

ЭВОЛЮЦИОННАЯ ДИНАМИКА В СИММЕТРИЧНЫХ ИГРАХ С РАЗЛИЧНЫМИ ИНДИВИДАМИ И КОНКУРЕНЦИЯ СТАНДАРТОВ

Научный руководитель – , к. э.н., PhD

1. Введение

Эволюционная динамика в теории игр — популярная тема для научных исследований. Она берет свое начало в биологических науках, где служит как средство описания естествен­ного отбора и развития видов во времени. Тем не менее, эволюционная динамика имеет множество интерпретаций и применений в экономики. Она позволяет обойти предположе­ние о рациональности и совершенных ожиданиях агенты. В рамках этой модели можно предположить, что в индивидах либо уже заложена стратегия, либо они принимают реше­ния основываясь не на точных аналитических предсказаниях, а на так называемых "rules of thumb" — наблюдаемых практических закономерностях (одним из таких правил может служить подражание наиболее успешным индивидам). Такая формулировка предположе­ний, во-первых, выглядит во многом более реалистичной, чем стандартное предположении о совершенно рациональных индивидах, а во-вторых, позволяет применить теорию игр и заданной эволюционной динамики для анализа долгосрочного равновесия.

Игры, которые играют индивиды, предполагаются идентичными для любых конкрет­ных попарных сведений индивидов. Более того, информация совершенна в том смысле, что на момент принятия решения индивид знает характеристики оппонента и матрицу вы­игрышей в предстоящем взаимодействии. Это логично, так как трудно представить себе ситуации в биологии, когда верно было бы обратное. Однако, в экономике может иметь смысл и взаимодействия различных индивидов, а также условия неполной информации, порождаемые различиями индивидов. Такая трактовка не была широко исследована, в отличие от игр с полной информацией.

НЕ нашли? Не то? Что вы ищете?

В данной работе строиться модель эволюционной динамики с различными индивида­ми и, соответственно, различными матрицами выигрышей в каждом конкретном сведение двух индивидов. При это работаю предположения широко использующиеся в существую­щей теории — близорукость индивидов и существование инертности. Эти предположения вместе с различиями среди индивидов порождают неполную информацию, так как на мо­мент выборы своей стратегии (из-за инертности индивиды не могут мгновенно приспосаб­ливать свои действия к меняющимся условиям), агент не знает точно, с кем ему придется иметь дело, т. е. он не знает выигрышей оппонента.

Базовый элемент теории — типичная игра с двумя игроками. Это игра по своей приро­де является координационной. Предлагается интерпретировать данную модель, например, как войну стандартов, в частности операционных систем, в нашей работе обозначенных как Linux и Windows. Индивид может выбрать одну из систем в начале периода, не зная с кем ему придется столкнуться в течение периода. При этом максимальный выигрыш до­стигается, когда оппоненты используют один и тот же стандарт — операционную систему. При этом предполагается, что выгода от одного из стандартов (Windows) фиксирована и известна по индивидам, так как полезность индивидов от другой системы (Linux) отли­чается для каждого отдельного индивида. На момент выбора стратегии агентам доступ­на информация о количестве пользователей системы в прошлом периоде, что позволяет сформулировать, а также функция распределения полезности от Linux по индивидам, что позволяет сформировать ожидания. При этом, предполагается, что индивиду не доступна информация о функции динамики — изменения пропорции во времени, то есть при приня­тии решения агент не может проследить стратегические аспекты, а руководствуется лишь ожидаемом выигрыше в следующем периоде. Это в точности соответствует предположению о близорукости индивидов.

В разделе 2 приводится краткий обзор литературы. В разделе 3 приводится описания модели при полной информации, для дальнейшего сравнения. В разделе 4 добавляется различие между индивидами сначала в общем виде, затем с конкретной функцией и де­лаются выводы относительно изменения свойств долгосрочного динамического равновесия по сравнению с эквивалентными играми с полной информацией. Наконец, в разделе 5 приводится применения модели для иллюстрации возможности сосуществования систем в условиях конкуренции между ними.

2. Обзор литературы

Введение в эволюционную динамику хорошо представлено в книге Крессмана «Эволюци­онная динамика и игры в расширенной форме» (Cressman, 2003). Несмотря на то, что книга посвящена в основном играм в расширенной форме, она знакомит читателя и с играми в нормальной форме. Она вводит основные определения, покрывая многие типы игр и эво­люционных динамик. Однако, речь идет об играх с полной информацией, в то время как данная работа посвящена играм с неполной информацией.

Тем не менее, удобно принять определения данные в данной книге, чтобы использо­вать далее в данной работе. Определения даны далее в соответствии с Cressman, 2003. В симметричной игре в нормальной форме, G, имеется п чистых стратегий ei,…,en. Тогда S = {ei,…,en} — множество чистых стратегий. В игру G играют два игрока. Процесс игры заключается в выборе игроками чистой стратегии ei и ej первым и вторым игроком соот­ветственно. В зависимости от выбранных стратегий игроки получают выигрыш π(ej,ej). Так же важны смешанные стратегии. Смешанная стратегия — это определенный набор вероятностей , который определяет вероятность того, что игрок сыграет каждую чистую стратегию из S. Вектор вероятностей с нулями везде, кроме i-того элемента (pj = 1) определяет чистую стратегию ej. Допустим A = {aij} — n х n матрица выигрышей, в которой каждый элемент aij = π(ej,ej). Тогда выигрыш можно записать как

Другая интерпретация, которая активно используется в этой работе, подразумевает, что каждый из индивидов из совокупности играет определенную стратегию ej. Индивиды слу­чайно совмещаются попарно и играют игру. При предположении о бесконечно большом размере популяции, или, альтернативно, о том, что индивиды могут быть совмещены сами с собой, можно сказать, что вероятность того, что оппонент сыграет стратегию ej равнa pj, где pj — пропорция популяции, и грающая ej. При эт ом называется состоянием по­пуляции, а смешанная стратегия стратегией популяции. Тогда ожидаемый выигрыш от использования стратегии . Эволюционная динамика, обсуждаемая в частности в этой работе и в Cressman, 2003, подразумевает детерминистический процесс р, т. е. состояния популяции, что определяет изменение ожидаемых выигрышей во времени.

Существует много альтернативных способов задания динамики эволюции состояния популяции. Так как эволюционная теория игр тесно связана с биологией, много внимания было уделено динамики воспроизведения (replicator dynamic). При этом предполагается, что выигрыши от игры задают количество потомства каждого индивида, определяя состо­яние популяции в следующем периоде. Таким образом, если nj — количество индивидов, играющих ej, в дискретном времени количество индивидов такого типа в следующем периоде будет задано как . Больший интерес имеет состояние популяции pj. Легко показать, что эволюция состояния будет задана следующим образом: . Среди понятий, введенных в книге, особенную роль для нас играет понятие «точки отдыха», т. е. такое состояние популяции р, что р' = р. Для разных игр характеристики точек отдыха разные. Например, для двух разновидностей игр 2x2 — ястребы и голуби и координация существует уникальная внутренняя (т. е. 0 < р < 1) точка отдыха. Для игр типа дилемма заключенных внутренней точки отдыха не существует. Однако траектория динамик различается, см. рис. 1. Данная работа сконцентрирована на координационных играх, поэтому следует обратить внимание, что в таких играх существует нестабильная внутренняя точка отдыха. И хотя в Cressman, 2003 это продемонстрировано на примере динамики подражания, схожий вывод может быть получен и для других динамик, в том числе динамики наилучшего ответа, использующейся далее. Положение данной точки от­дыха важно для нас, так как оно определяет необходимое начальное состояние популяции для вывода в какое состояние она придет в долгосрочном периоде.

Помимо основных определений и выводов теории в главах 2-6 и 6 приводится обзор результатов для эволюционных моделей, большая часть которых сфокусирована на иг­рах с полной информацией (Amann, Possajennikov, 2009). Тем не менее, часть моделей исследует ситуации с неидентичными индивидами. Как отмечают в своей статье Amann, Possajennikov (2009), такая ситуация может быть интерпретирована в биологии как межви­довые интеракции. Авторы обращают внимание читателя, что в литературе исследуются в основном случае, когда взаимодействие исключительно симметрично (напр. внутривидовое взаимодействие), либо чисто асимметрично (межвидовое взаимодействие).

Работа Kandori, Mailath & Rob (1993) посвящена эволюционной динамике в играх, в ко­торых поведение индивидов включает стохастический компонент. Хотя тема работа фоку­сируется на других аспектах долгосрочного равновесия, нежели обсуждаемые здесь, боль­шая ее часть посвящена эволюционным играм и сделано несколько заключений, важных для данной работы.

Базовые предположения модели Kandori, Mailath & Rob (1993) схожи используемым далее. Каждый индивид из популяции N (в модели описанной далее N à∞) в каждом периоде совмещается со случайными индивидами из этой же популяции и играет симмет­ричную игру. В этой ситуации особенную важность имеют два предположения, взятые из эволюционной теории: близорукость и инертность. Предположение о близорукости обосновывается тем, что индивиды не достаточно осведомлены и их аналитические способ­ности не настолько совершенны, чтобы учитывать стратегические моменты их действий. Как следствие, они не учитывают долгосрочных последствий своих действий и влияния их стратегий на поведение других индивидов. Можно сказать, что каждую игру они игра­ют как последнюю. Для нас это играет особенную важную роль, так как в нашей модели предполагается, что индивиды руководствуются наблюдаемым состоянием популяции, в то время как детерминистический характер задаваемой динамики позволял бы совершенно осведомленным индивидам просчитывать будущие состояния популяции и принимать ре­шения на их основе. Предположение об инертности обосновывается присутствием издержек смены стратегии и несовершенными знаниями индивидов и приводит к тому, что индивиды фиксируют свою стратегию в начале периода и не меняют ее до его конца. Данное предпо­ложение приводит к тому, что на момент встречи с конкретным оппонентом, индивид не может скорректировать свою стратегии, чтобы получить максимальный выигрыш от от­дельной игры. Поэтому, стратегии выбираются учитывая ожидаемые свойства оппонента на основании информации о состоянии популяции.

3. Координационные игры с идентичными индивидами

Модель, представленная в данной работе имеет ограниченную интерпретацию в рамках биологической эволюции. Трудно представить себе ситуацию, которая объясняла наличие неполной информации в эволюции видов. Однако, возможно описать ситуацию в эконо­мических терминах. Одно из таких объяснений — борьба различных стандартов на одном рынке. Координационная игра заключается в том, что наибольшие выигрыши индивиды получают, когда они следуют одинаковым стандартам. При этом у разных стандартов мо­гут быть различные выигрыши в индивидуальной игре. Например, представим себе следу­ющую ситуацию. Каждый индивид из неограниченно большой популяции может выбрать в начале периода систему, которой он будет пользоваться — Windows или Linux. При этом, из-за наличия инертности, в течение одного периода свой выбор нельзя менять. Это может быть, например, из-за того, что смена системы связана с большими издержками и менять ее имеет смысл, когда она отслужит свой срок (когда текущая версия системы устареет или произойдет системный сбой, требующий переустановку системы). В течение периода индивиды попарно совмещаются, и играют следующую симметричную игру:

При этом подразумевается, что максимальный выигрыш получается тогда, когда игроки используют одну и ту же систему, так как их работа более совместима в данном случае. Более того, выигрыш от совместного использования Linux выше, чем от совместного ис­пользования Windows, так как Linux легче поддается настройке, является более безопасной, гибкой, дешевой и надежной системой. Таким образом: . Для простоты положим, что . То есть, игра сводится к следующей форме:

Предположим, что на момент выбора стратегии, индивид знает состояние популяции, т. е. пропорции пользователей Linux и Windows. Тогда, максимизируя свой ожидаемый выиг­рыш, индивид будет выбирать стратегии. Поскольку на момент принятия решения агент не знает, с кем ему придется иметь дело в начале периода и он знает, что сменить страте­гию он не сможет, то ожидаемые выигрыши зависят от количества пользователей каждой системы на момент принятия решения и заданы следующим образом:

где пl, пw — ожидаемые выигрыши от Linux и Windows соответственно, a p — пропорция пользователей Linux. Тогда, индивид будет выбирать Linux если:

Таким образом, мы неявно нашли равновесие в смешанных стратегиях. Эта точка опре­деляет поведение индивидов в следующем периоде при заданном начальном условии. Что­бы более конкретно описать эволюционную динамику, определим точно сам тип динами­ки. Далее будет использовать частный вид динамики наилучшего ответа, т. е. при которой индивид выбирает ту стратегию, которая обеспечивает наибольший выигрыш при наблю­даемых пропорциях популяции пользователей на момент принятия решения. Напомним, что индивид не принимает во внимание стратегические последствия своих действий, т. е. играет каждый этап так, как будто он последний (предположение о близорукости). Таким образом, индивид выберет в периоде t +1 Linux если:

т. е. функция динамики сводиться к следующему виду:

где N — размер популяции, a — индикатор, равный единице если и нулю в обратном случае. Таким образом, из-за идентичности индивидов и их мгновенной реакции (имеется в виду сразу же в следующем периоде) из-за динамики наилучшего отве­та, процесс приспосабливается к долгосрочному равновесию на следующий же период. Для технической точности отметим, что в вышеприведенной формуле подразумевается, что в случае, если выигрыши равны, то индивид не меняет своей стратегии. Очевидно можно решить данное разностное уравнение:

Следует отметить, что при t à∞ предыдущее верно не только для динамики наилуч­шего ответа но и для любой динамики дарвиновского типа, хотя приспособление не будет мгновенным (как при динамике наилучшего ответа) в общем случае, где дарвиновская динамика определена как:

где ps(t) — пропорция популяции, играющая стратегию s в период t, a пs (t) — ожидаемый выигрыш от данной стратегии (Kandori, Mailath & Rob, 1993). Это очень общее определе­ние, которое охватывает широкий спектр различных динамик. Таким образом, для таких динамик (в т. ч. для динамики наилучшего ответа) долгосрочное равновесие можно опре­делить как:

Следовательно, долгосрочное равновесие в данном случае полностью и однозначно опре­деляется начальными условиями динамической системы. При этом, что особенно важ­но, критическая пропорция популяции, которая отделяет два долгосрочных равновесия равна вероятностям равновесной смешанной стратегии в одиночной игре.

4. Координационные игры с различными индивидами

4.1 Вывод динамики состояния популяции

Очевидно, что предположение об идентичности игр (а именно матрицы выигрышей) для всех индивидов не реалистично в нашей экономической интерпретации. Вряд ли можно оспорить тот факт, что полезность от пользования Linux зависит от характеристик ин­дивида. Так, в то время как большое преимущество Linux — в гибкой настраиваемости, для того, чтобы приспособить систему под свои нужды необходимо несколько углублен­ное знание компьютерных систем. Индивид, который не обладает такими знаниями просто не сможет получить полную полезность от Linux. Кроме того, существует распростра­ненное мнение, что настройка Linux отнимает много времени. Соответственно, индивиды с высокой альтернативной стоимостью времени не смогут позволить себе тщательную на­стройку и будут получать меньшую полезность от использования системы. Следовательно, предположение об одинаковых выигрышах слишком ограничивающие. Дальнейший раздел посвящен случаю с неодинаковыми индивидами.

Предположим, что индивиды играют следующую игру:

где xi определяется характеристиками индивида i и этот параметр можно интерпрети­ровать как полезность конкретного индивида от использования Linux. Допустим, что по­лезность индивида i задана функцией f (p), см. рис. 2, где p — относительное положение индивида при сортировке всей популяции по возрастанию полезности от Linux. Т. е. для индивида с р = ро будет существовать ро *N индивидов ценящих Linux меньше, чем он и (1 – ро)*N ценящих больше. Таким образом, область определения функции f (р) — [0,1]. Допустим, область значений f) равняется [a, b]. Поскольку индивиды предполагаются "отсортированными" по возрастанию, f (р) — возрастающая функция.

В начале периода, когда индивид выбирает стратегию, он не знает с какими типами оппонентов ему придется столкнуться. Поэтому, он выбирает стратегию в зависимости от наблюдаемых пропорций населения играющих ту или иную стратегию. При предположении о том, что все пары совмещений индивидов одинаково вероятны, полезность ожидаемого оппонента будет задана:

где F (р) — первообразная от f (р). Соответственно, индивид при выборе стратегии будет руководствоваться следующей матрицей выигрышей:

Таким образом, индивид выберет Linux в периоде t если:

Количество пользователей Linux в периоде t будет задано следующим обр азом, где индикатор, равный единице, если и нулю в обратном случае:

Здесь задает положение маргинального индивида, т. е. все индивиды, имеющие меньшую склонность к Linux xi, чем маргинальный индивид, будут выбирать Windows в следующем периоде. Зная f(p) возможно найти положение маргинального пользователя, см. рис. 3:

Так как пользователями Linux будут все индивиды, которые получают большую пользу от него, чем маргинальный пользователь, можно записать динамику p(t):

Так как функция f (p) — возрастающая, функция f-1(p) существует. Данное разностное уравнение определяет детерминистическую динамику состояния популяции в дискретном времени. Очевидно, что свойства этой динамики зависят от функции распределения полезности от использования Linux разных индивидов f(p). Поэтому дальнейший анализ проводится для одного конкретного вида такого распределения.

Для технической точности, следует отметить, что так как область значений функции f (p) равна [а, b], то область определения функции f-1(p) — [а, b]. Однако, аргумент мо­жет принимать значения вне этого интервала, поэтому следует доопределить выражение динамики:

что равносильно следующему:

4.2 Динамика изменения состояния популяции при равномерном распределении полезности

Предположим, что полезность от использования Linux возрастает с постоянной скоростью от 0-го до N-ro индивида. Дальше мы будем называть такое распределение равномерным. Допустим, что область значений f(p) равна (0, u]. То есть индивид, наименее склонный к Linux имеет неограниченно малый положительный xi (при бесконечно большой популя­ции), в то время как наиболее склонный индивид имеет xi равный u. Тогда f(p) можно представить таким образом:

Подставляя эту функцию в (4) получаем динамику состояния популяции (заметим, что ):

Решая данное разностное уравнение, получаем, что в долгосрочном периоде состояние по­пуляции будет определяться следующим образом:

где w/u – критическая пропорция, т. е. такая величина начального условия системы, которая разделяет два различных стабильных долгосрочных равновесия. Заметим, что теперь критическая пропорция не равна вероятности, получаемой при нахождения равновесия в смешанных стратегиях в одинарной игры, как было при идентичности индивидов. Из вы­ражения (6) видно, что введение различий между индивидами имеет важное последствие на всю динамику игры: требования к критической пропорции меняются. Для иллюстра­ции данной идеи сравним критическую пропорцию игры с равномерным распределением полезности, p*v = w/u, и эквивалентный по ожидаемому выигрышу вариант этой игры с идентичными индивидами. Под эквивалентным по ожидаемому выигрышу вариантом здесь понимается такая игра, в которой все индивиды одинаковы и получают выигрыш равный ожиданию выигрыша от случайного индивида в неэквивалентном варианте. В об­щем виде такая игра записывается следующем образом:

Используя формулы (1), (2), (5), получаем, что критическая пропорция для такой игры равна - Сравнивая две пропорции, получаем:

Следовательно, если пользователи получают в среднем больший выигрыш от использова­ния Linux (что является нашим предположением), т. е. если общество бы было бы в лучшем положении, при повсеместном использовании Linux, p = 1, по сравнению с альтернативным равновесием p = 0, то при идентичных выигрышах индивидов требуется большая критическая масса для достижения эффективного равновесия p = 1, в то время как при различных индивидах (с равномерным распределением полезности) размер необходимой критической массы меньше.

Вывод 1: Размер необходимой критической массы для достижения эф­фективного с точки зрения общества равновесия в долгосрочном периоде меньше при специализации (равномерном распределение полезности от использования Linux по индивидам), чем при идентичности индивидов, при эквивалентности игр по ожидаемым выигрышам.

Заметим, что если Linux — неэффективное равновесие, т. е. в среднем приносит меньший выигрыш по сравнению с Windows ( т. е. ), то, наоборот, размер необ­ходимой критической массы будет выше при специализации (равномерном распределении полезности). Это напрямую следует из (7).

Верно и обратное утверждение: для достижения одного и того же уровня критиче­ской массы, индивидам нужно предложить больший в среднем выигрыш при идентичности индивидов, по сравнению с равномерным распределением полезности. Для иллюстрации данного утверждения рассмотрим эквивалентную по критической массе игру, т. е игру следующего типа:

где значение z одинаково для всех игроков и таково, что критическая масса такая как и в игре с равномерным распределением полезности – w/u. Зная, что критическая масса в таких играх равна , можно найти z:

Соответственно, если Linux — эффективное равновесие, то z > E(f (p)), в обратном случае z < E(f (p)).

Вывод 2: Для достижения одного и того же уровня критической массы (т. е. при эквивалентности игр по критической массе) индивидам нужно предложить в среднем больший выигрыш при игре с идентичными инди­видами, чем при специализации, если Linux — эффективное равновесие; в обратном же случае, необходимый в среднем выигрыш меньше.

4.3 Анализ степени неидентичности

Рассмотрим следующую ситуацию. На рынке существует стандарт (например, операци­онная система), назовем его Windows. Фирма разрабатывает альтернативный стандарт. Перед выпуском, в периоде 1, она может сконструировать стандарт так, что он будет одинаково полезен всем пользователям, либо, так, что полезность от него будет равно­мерно возрастать от наименее склонного пользователя к наиболее склонному. Способность фирмы влиять на распределение выигрышей можно интерпретировать, например следу­ющим образом: фирма может настроить систему таким образом, чтобы в равной степени удовлетворять всех индивидов; или она может предоставлять какие-то функции, которые будут повышать ценность системы для одной группы населения в ущерб другой. В пери­од 2 система выходит на рынок и случайная часть пользователей p (0) ~ U[0,1] начинают использовать систему, в то время как 1-p(0) продолжают придерживаться старой. Пропорция p(0) может быть объяснена активной рекламой системой перед ее выходом, неопределенности среди пользователей об ее эффективности, склонностью индивидов к разнообразию и экспериментированию. В последующих периодах происходит эволюционная динамика, описанная в разделе 4. Цель фирмы — максимизировать долгосрочную прибыль , где pLR — пропорция пользователей системы долгосрочном периоде, ПLR— некоторая константа, С — сумма выигрышей, обещанных индивидам в слу­чае совместного использования новой системы в координационной игре. Фирма принимает решение о том, как распределить выигрыши между отдельными индивидами. Допустим, фирма может распределить лишь фиксированное количество выигрышей . Тогда, зада­ча фактически сводится к максимизации pLR. Из раздела 4 мы знаем, что при данных распределениях plr может принимать лишь два значения: 1 и 0. При этом, вероятность, что pLR примет значение 1 равна Pr(p (0) > p*) = 1 — p*, где p* — критическая пропорция, определяемая, помимо всего прочего, выбранным фирмой распределением выигрышей (как было показано в разделе 4). Тогда, задача фирмы сводится к максимизации ожидаемой прибыли max E[П] = (1 — p*) • пLR — по переменной p* . Тогда, очевидно, что фирма предпочтет равномерное распределение, так как в данном случае критическая пропорция ниже, чем в случае идентичного распределения. Таким образом, специализация ведет к более высокой ожидаемой прибыли.

Попробуем показать это более формально, путем введения непрерывного параметра, определяющего степень неравномерности распределения. Допустим, функция распределе­ния задана следующим уравнением: . Таким образом, мы по­лучаем функцию, которая обладает несколькими особенностями. Во-первых, для любого значения γ суммарный выигрыш для всех индивидов одинаков:

Во-вторых, параметр γ определяет степень неравномерности распределения полезности.

Неравномерность растет вместе с γ. γ = 0 соответствует идентичности индивидов, а γ = 1 — равномерному распределению (см. рис. 4).

Из-за сложности расчетов трудно напрямую выявить в общем виде зависимость p*(γ). Тем не менее, используя численные методы, можно показать, что на интервале γ € [0,1] необходимая критическая масса падает с ростом степени неидентичности, достигая своего минимума в точке 1. Поскольку для всех функций данного класса общая сумма выплаченных выигрышей равна, фирма, максимизирующая ожидаемую прибыль в ситуации, описанной выше, будет выбирать на данном отрезке γ = 1.

Несколько сложнее ведет себя функция при γ > 1. В данном случае появляется внутренняя стабильная с одной стороны точка отдыха (см. рис. 5). Одновременно с этим, необходимая критическая масса, разделяющая два различных равновесия. Т. е. при дальнейшем увеличении на ожидаемую прибыль влияют два разнонаправленных эффек­та: понижение необходимой критической массы увеличивает ожидаемую прибыль, а удаление стабильного долгосрочного равновесия от точки p = 1 уменьшает прибыль. В ходе численных симуляций можно увидеть, что при достаточно больших γ второй эффект пересиливает первый. Таким образом, можно сделать вывод, что существует оптимальный уровень степени неидентичности, который минимизирует необходимую критическую массу, что максимизирует ожидаемую прибыль.

Стоит добавить, что при достаточно больших значениях γ внутренняя точка отдыха пропадает окончательно (см. рис 5), делая такие уровни неравномерности невыгодными.

Вывод 3: При данных предположениях, фирма выбирает достаточно вы­сокий уровень неравномерности распределения выигрышей γ* > 1. Во всех случаях, кроме вырожденного (γ = 1), это приводит к одновремен­ному использованию двух стандартов.

Таким образом, в рамках данной теории можно объяснить наличие одновременного использования нескольких стандартов, что наблюдается в реальности. Фирма находит оп­тимальным выбирать настолько неравномерную специализацию, что часть пользователей просто не заинтересована в использовании системы, даже при ее большой популярности, что является результатом того, что они не целевая аудитория системы.

5. Заключение

Мы проанализировали то, как меняется долгосрочное равновесие в ситуации, когда ин­дивиды играют координационную игру, при введении неидентичности распределения вы­игрышей от одного из стандартов. Было показано, что введение равномерного распреде­ления для выигрышей, критическая пропорция населения, необходимая для достижения эффективного равновесия (Windows или Linux — в зависимости от того, какой стандарт эффективней) уменьшается. Таким образом, равномерное распределение является более эффективным с точки зрения общества по сравнению с ситуацией идентичности инди­видов. Более того, в разделе 5 было показано, что при помощи численных методов, что равномерное распределение не самое эффективное, что большие уровни специализации могут быть еще эффективней.

Кроме того, предсказание модели состоит в том, что фирма, продающая стандарт будет пытаться захватить рынок при помощи гладкой специализации, т. е. расставляя акценты на выигрыши потребителей таким образом, чтобы вызвать цепную реакцию. Фирма бу­дет стремиться завоевать сначала самых склонных к стандарту потребителей, давая менее склонным такой уровень выигрышей, чтобы пропорция созданная первыми делала стан­дарт выгодным и для последних, создавая эффект снежного кома.

Наш анализ несколько ограничен в том смысле, что не рассматривается вариант от­вета со стороны конкурирующего стандарта, который может так же переключиться на стратегию специализации. Тем не менее, если продолжать рассматриваемый здесь пример конкуренции Windows-Linux, невозможность ответа может быть обоснована. Так, Windows — хорошо известная система, цель которой — удовлетворить широкое количество пользо­вателей. У нее есть лидирующая позиция на рынке и большое количество пользователей, которые ждут от нее стабильности, универсальности и простоты. Более того, это система которая разрабатывалась уже давно и большое количество кода используется уже доста­точно давно и многие части системы являются устоявшимися и "проверенными временем". В таких условиях перераспределение выигрышей, или, выражаясь иначе, смена специали­зации, может быть либо невозможно, либо недопустимо дорога.

Литература

1.  Ross Cressman, Evolutionary Dynamics and Extensive Form Games, MIT Press, Cambridge. MA (2003)

2.  Michihiro Kandori, George Mailath, Rafael Rob, Econometrica, Vol.61, No. l (January, 1993), 29-56

3.  Peyton Young, The Evolution Of Conventions, Econometrica, Vol.61, No. l (January, 1993), 57-84

4.  Erwin Amann, Alex Possajennikov, On The Stability Of Evolutionary Dynamics In Games With Incomplete Information, Mathematical Social Sciences, 310-321

5.  Robert Gibbons, A Primer In Game Theory

6.  Martin Osborn, A Coursse In Game Theory

7.  Tamas Rudas, Handbook of Probability

8.  Herbert Gintis, Game Theory Evolving