В главе 10 мы говорили о том, что повторение дилеммы заключенных позволяет игрокам, осознанно придерживающимся рационального поведения, сотрудничать ради взаимной выгоды. Давайте посмотрим, есть ли подобная возможность в эволюционной игре. Предположим, каждая выбранная пара игроков разыгрывает дилемму заключенных три раза подряд. Общий выигрыш игрока от такого взаимодействия — это сумма выигрышей, полученных за три раунда.
Каждый отдельный игрок запрограммирован на использование только одной стратегии, но она должна представлять собой исчерпывающий план действий. В игре с тремя ходами стратегия может предусматривать во время второго или третьего раунда выполнение действия, которое зависит от того, что произойдет в первом или втором раунде. Например, «Я буду сотрудничать при любых обстоятельствах» и «Я буду всегда отказываться от сотрудничества при любых обстоятельствах» — это допустимые стратегии. Однако также допустима стратегия «Я начну с сотрудничества и буду продолжать его, если вы сотрудничали во время предыдущего раунда, и откажусь от него во всех последующих раундах, если вы не сотрудничали во время первого». На самом деле эта последняя стратегия — не что иное, как стратегия равноценных ответных действий, или «око за око».
Для простоты анализа в этом разделе мы будем исходить из предположения, что в популяции могут существовать только два типа стратегий: «всегда отказ от сотрудничества» (В) и «око за око» (О). Из популяции случайным образом выбираются пары игроков, после чего каждая пара проводит игру определенное количество раз. Уровень приспособленности каждого игрока представляет собой сумму его выигрышей от всех повторений игры против конкретного соперника. Мы проанализируем, что происходит в случае двух, трех и
I. Игра с двумя повторениями. На рис. 12.2 представлена таблица выигрышей для игры, в которой встречаются два представителя популяции рестораторов и играют друг против друга в точности два раза. Если оба игрока относятся к типу В, оба откажутся от сотрудничества в обоих случаях, тогда, как показано на рис. 12.1, каждый из них получит выигрыш 288 в каждом раунде игры, то есть в сумме 576. Если оба игрока относятся к типу О, отказа не будет и каждый игрок получит в каждом раунде выигрыш 324, в сумме 648. Если один игрок относится к типу В, а другой к типу О, то во время первого раунда игрок типа В откажется сотрудничать, а игрок типа О будет сотрудничать; в итоге у первого выигрыш составит 360, а у второго — 216. Во время второго раунда оба игрока откажутся сотрудничать и получат выигрыш по 288 каждый. Таким образом, общий выигрыш игрока типа В будет 360 + 288 = 648, а игрока О — 216 + 288 = 504.
Рис. 12.2. Исходы дилеммы заключенных с двумя повторениями (в сотнях долларов в месяц)
В дважды повторяющейся дилемме заключенных мы видим, что стратегия В («всегда отказ от сотрудничества») — слабо доминирующая. Очевидно, что, если популяция состоит только из игроков типа В, мутанты О-типа не смогут ее захватить, поэтому В — эволюционно устойчивая стратегия. Но если популяция включает исключительно игроков типа О, мутанты В-типа не могут добиться большего, чем игроки О-типа. Означает ли это, что стратегия О («око за око») должна быть еще одной эволюционно устойчивой стратегией, подобно тому как в случае анализа этой игры с точки зрения рационального поведения игроков был бы сделан вывод о существовании равновесия Нэша? Ответ: нет. Если популяция изначально состоит только из игроков типа О и в игру вступают немногочисленные мутанты типа В, то последние в основном будут встречаться с игроками преобладающего типа О и получат такие же выигрыши, как и выигрыш игрока типа О в паре с другим игроком типа О. Но иногда мутант типа В будет встречаться с другим мутантом типа В и тогда получит более высокий выигрыш, чем получил бы игрок типа О в паре с игроком типа В. Таким образом, у мутантов