Сформулируем проблему следующим образом. Игрок оперирует неким набором вероятностей, представляющим собой потенциально бесконечную последовательность. Вначале он оценивает вероятность того, что другая сторона «действительно» предпочитает напасть т.е. что другой атакует, даже если сам он не опасается нападения, как Р1. Вторая величина Р2 есть вероятность того, что другой игрок думает, что я «действительно» предпочитаю напасть на него, т.е. что я нападу на него, даже если я не опасаюсь его нападения. Третья величина Р3 есть вероятность того, что он думает, что я думаю, что он «действительно» нападет. Четвертая величина Р4 представляет собой вероятность того, что он думает, что я думаю, что он думает, что я «действительно» нападу. Пятая, шестая, седьмая (и т.д.) вероятности строятся путем удлинения цепочки, состоящей из «он думает» и «я думаю» путем присоединения отдельной вероятности к каждому члену ряда. Полная вероятность того, что он нападет, тогда будет равна:

Проблема этой формулы в том, что нам нечем сгенерировать ряд. Каждая вероятность оценивается ad hoc и отражает добавочные данные к специфической информационной структуре отдельной ситуации. Нельзя, рассматривая несколько членов ряда как исходные данные, продолжить остальные в бесконечность или сколь-нибудь далеко, и математически оперировать всем рядом. Число элементов в таких рядах зависит от того, сколько времени хватит игроку для их приблизительного подсчета, или от резервов интеллекта, чтобы помнить их, так как каждый новый член ряда требует независимого процесса оценки. Правда, можно задать отдельные игры с информационными структурами, которые приводили бы к формуле для рядов — например, последовательность вращения колеса рулетки, определяющей, известна ли другому игроку моя «истинная» система ценностей; известно ли мне, что ему известно; известно ли ему то, что мне известно то, что известно ему, и т.д., но такие особые игры могут и не пролить свет на общую ситуацию, которую мы пытаемся охватить.

Нам нужна формулировка проблемы, которая позволяет работать с ограниченным числом произвольных параметров, представляющих, возможно, начальные, или «объективные» элементы рядов в контексте, который автоматически генерирует значения любых дополнительных вероятностей, которые могут быть представлены через неопределенное число повторений «он думает, что я думаю». Необходимо сформулировать проблему способом, который сделает ожидания каждого игрока функцией ожиданий других игроков.

<p><strong>«ТОЧНО РАЗРЕШИМАЯ» НЕКООПЕРАТИВНАЯ ИГРА</strong></p>

В качестве первой попытки можно назначить каждому из двух игроков основной параметр, представляющий вероятность того, что он будет атаковать, если он не должен этого делать. Значения этих параметров должны быть полностью известны обоим игрокам, причем каждому известно о том, что это известно другому. То, что я подразумеваю под «он не должен», заключает в себе следующую поведенческую гипотезу, состоящую из двух частей.

Первая часть нашей поведенческой гипотезы состоит в том, что если два игрока понимают что политика взаимного ненападения — лучший из возможных исходов для них обоих, признают это «решение» и выберут воздержание от нападения. Если, например, матрица выигрышей выглядит так, как показано рис. 19, то каждый будет уверен в их взаимном доверии и выберет стратегию, которая принесет обоим игрокам лучший результат из возможных. Это требование к рациональности двух этих игроков представляется весьма умеренным[113]. Оно является сомнительным, как я полагаю, главным образом тогда, когда превосходство взаимного ненападения над односторонним внезапным нападением слишком невелико, чтобы оба полностью доверяющих друг другу игрока были полностью уверены, что они понимают друг друга. И возможность того, что один из них соблазнится нарушить дисциплину во имя собственной безопасности или из страха, что другой может предпринять попытку обезопасить себя, учтена во второй части поведенческой гипотезы.)

Вторая часть гипотезы состоит в том, что существует некая вероятность (Рr для игрока R, и Рc для игрока С) того, что этот игрок действительно нападет, когда он выбрал (или ему следовало выбрать) стратегию ненападения, т.е. его решение будет противоречить первой части нашей гипотезы. В этом и заключается суть мысли о том, что игрок может напасть, когда этого он этого делать «не должен». Но вопрос о том, что именно представляет этот параметр, мы оставим открытым: это может быть вероятность иррациональности игрока или вероятность того, что матрица выигрышей понята неверно, и что «в действительности» этот игрок предпочитает одностороннее внезапное нападение, либо вероятность того, что кто-нибудь ошибется и по неосторожности пустит в ход средства нападения. Для каждого из игроков в нашей модели решения этот параметр можно назвать «экзогенным»: эти данные предоставляются извне. Они не генерируются в процессе взаимодействия двух наших игроков.

Перейти на страницу:

Похожие книги