Благодаря развитию компьютерных технологий в 2007 году Chinook научилась заглядывать далеко в будущее и собрала настолько обширный архив, что смогла вырабатывать идеальную стратегию от начала до конца игры. Это было выдающимся достижением, достойным страниц Science. Однако идеальная стратегия так бы и осталась никому не известной, если бы не матчи с Тинсли. Как позже высказался один из разработчиков Chinook, «проект мог бы умереть в 1990 году, если бы у него не нашлось достойного человека-противника».

Хотя стратегия Chinook была идеальной, Шеффер не рекомендовал использовать ее для игры с менее квалифицированным противником. Ранние матчи Chinook с участием людей показали, что отклонение от оптимальной стратегии часто приносит пользу, заставляя противника делать ошибки. Дело в том, что, в отличие от Chinook, большинство людей не способны заглядывать на несколько десятков ходов вперед. В таких играх, как шахматы и покер, где идеальной стратегии не существует, риск ошибки еще выше. И здесь мы вправе задаться важным вопросом: что происходит, когда мы применяем теорию игр к слишком сложным для полного понимания играм?

И Тобиас Галла, физик из Манчестерского университета, и Дойн Фармер пытались выяснить, работает ли теория игр со сложными играми. Теория игр базируется на предположении, что все участники ведут себя рационально, иными словами, отдают себе отчет о последствиях принятых решений и выбирают наиболее благоприятные из них. В простых играх вроде крестиков-ноликов или в «дилемме заключенного» просчитать все имеющиеся варианты не трудно, поэтому их исход почти всегда определяется равновесием Нэша. Но что происходит в играх, устроенных более хитро?

В силу сложности шахмат и ряда вариантов покера ни игроки-люди, ни игроки-машины так и не нашли для них оптимальную стратегию. Подобная проблема существует и на финансовом рынке. Здесь можно получить доступ к огромному количеству важной информации – от стоимости акций до доходности облигаций, – но взаимоотношения банков и брокеров, от которых дрожит и сотрясается рынок, слишком запутаны, чтобы до конца их понять.

Покерные боты пытаются обойти эту проблему, перед началом игры «заучивая» набор стратегий. Но в реальной жизни игрокам приходится осваивать стратегии во время игры. Экономисты предположили, что при выборе стратегии люди руководствуются «мотивацией, основанной на опыте», – попросту повторяют те действия, которые в прошлом принесли им успех. Галла и Фармер заинтересовались: помогает ли модель обучения приблизиться к равновесию Нэша в сложных играх. Кроме того, им хотелось посмотреть, что происходит, если игра не «выравнивается» до оптимального результата. Какую модель поведения мы будем наблюдать в данном случае?

Галла и Фармер разработали игру, в которой двум участникам-компьютерам предлагался выбор из 50 возможных ходов. В зависимости от выпавшей комбинации каждый получал вознаграждение, определявшееся случайным образом перед началом игры. От размера вознаграждения зависело, насколько напряженной будет борьба. Приз присуждался либо по принципу нулевой суммы (потери одного игрока равнялись выигрышу второго), либо был одинаковым для обоих соперников. Память игроков настраивалась таким образом, чтобы в одних играх они «запоминали» все свои предыдущие ходы, а в других – только несколько последних.

Ученые увидели, что игроки с разными заданными уровнями конкуренции и памяти постепенно меняют стратегию и учатся делать все более выгодные ходы. Запрограммированные на слабую память, они снова и снова повторяли одни и те же решения и часто доходили до того, что принимались «обезьянничать» друг у друга. Но если игроки обладали хорошей памятью и играли в условиях жесткой конкуренции, то начинали происходить весьма любопытные события. Принимаемые соперниками решения не стремились к равновесию, напротив, бешено варьировались. Они вели себя непредсказуемо, как шарик рулетки, движение которого студентом пытался изучать Фармер. Ученые заметили: чем больше было число участников, тем чаще они принимали решения безо всякой системы. Судя по всему, в сложных играх предугадать выбор игроков практически невозможно.

Ученые отметили и другие поведенческие паттерны, в том числе те, что ранее наблюдались в реальных играх. Когда в начале 1960-х математик Бенуа Мандельброт изучал финансовые рынки, он обнаружил, что периоды увеличения или уменьшения волатильности (статистического показателя, характеризующего изменчивость цен) на рынках акций имеют тенденцию собираться в кластеры. «Большие изменения следуют за большими изменениями, – отметил он, – а мелкие – за мелкими». Возникновение «кластеризации волатильности» волнует умы экономистов и по сей день. Галла и Фармер наблюдали в своей игре тот же феномен. Они предположили, что этот паттерн – просто следствие того, что множество людей пытаются изучать сложную структуру финансовых рынков.

Перейти на страницу:

Похожие книги