Существуют и другие трудности. Теория игр показывает вам, как минимизировать свои потери в схватке с идеальным противником. Но если ваш противник допускает промахи – или если в игре участвуют более двух игроков, – возникает соблазн отклониться от «оптимальной» стратегии равновесия Нэша и воспользоваться слабостями соперников. Например, начать со стратегии равновесия, а затем постепенно менять тактику в зависимости от того, что удалось узнать о противнике. Впрочем, такой подход сопряжен с риском. Туомас Сандхольм из Университета Карнеги – Меллона отмечает, что игрокам необходимо найти баланс между возможностью эксплуатировать оппонента и оказаться жертвой эксплуатации с его стороны. Каждому хочется использовать слабые стороны противника к своей выгоде, но никто не хочет, чтобы его самого использовали более сильные игроки. Защитные стратегии, такие как равновесие Нэша и тактика, применяемая ботом Даля, способны защитить вас от сильных соперников, но не позволяют эксплуатировать чужие ошибки и дают слабым соперникам отделаться легким испугом. Следовательно, более разумно варьировать стратегию в зависимости от поведения противника. Как учит старая пословица: «Играй не с картами, а с человеком».

К сожалению, пытаясь использовать других, игрок иногда сам попадает в ловушку. Сандхольм называет это «проблемой обучения и эксплуатации». Представим себе, что ваш оппонент демонстрирует агрессивный стиль игры, – заметив это, вы меняете тактику, чтобы извлечь выгоду из его темперамента. Но ваш соперник внезапно переключается на более консервативный стиль и выигрывает на том, что вы поверили (ошибочно!) в его боевой настрой.

Исследователи оценивают воздействие проблемы обучения и эксплуатации на игру, измеряя подверженность своих ботов эксплуатации, то есть максимальные ожидаемые потери в случае, если программа неверно спрогнозирует поведение противника. Совместно с аспирантом Сэмом Гензфридом Сандхольм разрабатывает «гибридных» ботов, которые комбинировали бы стратегию равновесия с моделированием поведения оппонента. «Мы хотим научиться использовать слабых соперников, а в игре против сильных – стремиться к равновесию», – объясняют ученые.

Покерные программы стремительно развиваются. Боты – участники покерного первенства для компьютеров – умнеют с каждым годом, и Лас-Вегас уже наводнен покерными автоматами, способными переиграть практически любого. Но действительно ли компьютеры превзошли людей? Неужели самые продвинутые боты играют лучше человека?

По мнению Сандхольма, говорить о том, что мы миновали некую критическую точку, пока рано, и тому есть несколько причин. Для начала нужно определить лучших покеристов-людей. К сожалению, в покере трудно назвать чемпионов – здесь нет своих Гарри Каспарова или Мариона Тинсли. «Мы, по правде говоря, не знаем, кто играет в покер лучше всех», – замечает Сандхольм. Кроме того, в покере трудно организовывать игру людей против машин. Между собой боты соревнуются ежегодно, однако смешанные матчи проходят намного реже. По словам Сандхольма, заманить на такие матчи покерных профи почти невозможно.

Но иногда подобные мероприятия все же проводятся. В 2007 году профессиональные покеристы Фил Лаак и Али Эслами сошлись один на один с ботом Polaris, созданным командой из Университета Альберты. Переиграть Polaris было непросто – бот не пытался использовать слабости оппонентов, но применял стратегию, близкую к равновесию Нэша.

Выбор кандидатов удивил покерное сообщество. Лаак был знаменит своим гиперактивным поведением: во время игры он вскакивал из-за стола, прыгал, катался по полу, отжимался. Эслами был едва известен публике по нескольким телевизионным турнирам. Но оба игрока обладали именно теми навыками, которые были нужны ученым. Хорошие покеристы, они не стеснялись выражать свои мысли и чувства, и их не смущала необычная обстановка, в которой протекал поединок человека с машиной.

Соревнование организовали в рамках проходившей в Ванкувере конференции по проблемам искусственного интеллекта. Соперникам предстояло играть в лимитный техасский холдем – ту самую разновидность покера, в которую позже будет играть в Лас-Вегасе бот Даля. Хотя и Лаак, и Эслами играли с Polaris по отдельности, в конце каждой сессии их очки суммировались. Это был поединок «машина против людей», где Лаак и Эслами сражались с Polaris единым фронтом. Чтобы минимизировать фактор случайности, карты раздавали по зеркальному принципу: те, что доставались Polaris, в следующей игре получали люди, и наоборот. Кроме того, организаторы четко определили условия выигрыша: для победы необходимо набрать на 250 долларов больше фишек, чем противник.

Перейти на страницу:

Похожие книги