Авинаш Диксит - Стратегические игры. Доступный учебник по теории игр
2. Примеры и истории о стратегических играх
С учетом целей, поставленных в разделе 1, мы сначала предложим вам ряд простых примеров, многие из которых позаимствованы из ситуаций, с которыми вы наверняка сталкивались в своей жизни. В каждом примере мы указываем важный стратегический принцип. Все эти принципы более детально рассматриваются в следующих главах; кроме того, после каждого примера мы сообщим, где найти более подробную информацию. Однако не торопитесь сразу же переходить к соответствующим главам, сначала просто прочитайте все примеры, чтобы получить предварительное представление обо всех аспектах стратегии и стратегических игр.
А. Как выполнить обводящий ударТеннис высокого уровня состоит из незабываемых поединков между лучшими игроками: Джон Макинрой против Ивана Лендла, Пит Сампрас против Андре Агасси, Мартина Навратилова против Крис Эверт. Возьмем в качестве примера финальный матч Открытого чемпионата США по теннису между Эверт и Навратиловой[2]. Навратилова у сетки только что ударила по мячу с лета, отправив его в сторону Эверт на заднюю линию. Эверт вот-вот выполнит обводящий удар. Какой удар ей лучше сделать – по линии поля или по диагонали? И следует ли Навратиловой ожидать удара по линии и сделать наклон в соответствующую сторону или удара по диагонали и наклониться в другую сторону?
Здравый смысл говорит в пользу удара по линии. При таком ударе мячу предстоит преодолеть меньшее расстояние до сетки, а значит, у другого игрока останется меньше времени на то, чтобы правильно среагировать. Однако это не означает, что Эверт следует постоянно использовать этот удар. Если бы она поступала именно так, Навратилова ожидала бы этого и подготовилась, поэтому удар не был бы результативным. Для того чтобы повысить шансы на успех в случае обводящего удара по линии поля, Эверт необходимо использовать удар по диагонали достаточно часто, чтобы Навратиловой каждый раз приходилось угадывать его направление.
То же самое происходит и в футболе: когда на третьем дауне остается продвинуть мяч еще на один ярд, бег с мячом на середину поля – это процентная игра (то есть наиболее часто применяемая тактика игры), но время от времени нападающие должны делать в таких ситуациях пас, чтобы держать команду защиты в напряжении.
Таким образом, самый важный общий принцип действий в подобных ситуациях состоит не в том, что Эверт следует делать, а в том, чего ей делать не следует: она не должна выполнять одно и то же действие постоянно или систематически. В противном случае Навратилова будет знать, как реагировать на ее действия, и шансы на успех у Эверт снизятся.
Отсутствие систематичности в действиях означает нечто большее, чем попытки не делать один и тот же удар в подобных ситуациях. Эверт также не должна сугубо механически переключаться между двумя ударами – Навратилова заметит и использует эту закономерность или любую другую систему, поддающуюся обнаружению. Эверт необходимо делать выбор в каждом конкретном случае в произвольном порядке, чтобы помешать такому угадыванию.
Общая идея о смешивании приемов игры хорошо известна даже спортивным комментаторам на телевидении. Но у нее есть и другие аспекты, требующие углубленного анализа. Почему удар вдоль линии поля – процентная игра? Должен ли теннисист вести ее в 80, 90 или 99 процентах случаев? Насколько важен масштаб соревнований – например, следует ли делать пас на третьей попытке во время регулярного сезона, но не делать во время Суперкубка? Как игроки смешивают приемы игры в реальных условиях? Что происходит, когда появляется третья возможность (например, свеча в теннисе)? Мы проанализируем эти вопросы и ответим на них в главе 7.
Фильм The Princess Bride («Принцесса-невеста», 1987) иллюстрирует эту идею на примере «состязания на смекалку» между героем (Уэстли) и злодеем (Виззини). Уэстли должен отравить вино в одном из двух кубков, а Виззини предстоит решить, кто из какого кубка будет пить. Виззини анализирует ряд запутанных доводов в пользу того, почему Уэстли должен отравить вино в определенном кубке. Однако все они внутренне противоречивы, поскольку Уэстли может разгадать логику Виззини и добавить яд в другой кубок. И наоборот, если Уэстли выберет определенный кубок с помощью какой-то конкретной логики или системы, Виззини может предвидеть это и выпить вино из другого кубка, оставив Уэстли кубок с отравленным вином. Стало быть, стратегия Уэстли должна быть случайной и бессистемной.
Эта сцена иллюстрирует еще один момент. В фильме Виззини проигрывает и расплачивается за это жизнью. Как оказалось, Уэстли отравил вино в обоих кубках: на протяжении последних нескольких лет он вырабатывал иммунитет к этому яду. Следовательно, Виззини вел игру в крайне неблагоприятных условиях с точки зрения наличия информации, что и привело к фатальному исходу. Иногда игроки могут преодолеть проблему асимметричности информации; в главе 8 и главе 13 рассматривается вопрос о том, когда и как они могут это сделать.
Б. Мышиная возня со средним балломВы записались на курс, который оценивается по средней успеваемости. Независимо от того, каких успехов вы добьетесь в абсолютном выражении, всего 40 процентов студентов получат оценки А и всего 40 процентов – оценки B. Следовательно, вы должны упорно трудиться, причем не только в абсолютном выражении, но и относительно того, насколько старательно трудятся ваши товарищи по учебе (на самом деле «враги по учебе» кажется в данном контексте более подходящим выражением)[3]. Это понимают все студенты, поэтому после первой же лекции они собираются на импровизированное совещание и договариваются не проявлять чрезмерного усердия. Спустя несколько недель искушение получить преимущество перед остальными, приложив чуть больше усилий, становится непреодолимым. В конце концов, ваши сокурсники не могут видеть все, что вы делаете, и не имеют реального влияния на вас, а выгода от повышения среднего балла весьма существенна. В итоге вы начинаете чаще заходить в библиотеку и оставаться там подольше.
Проблема в том, что остальные делают то же самое. Следовательно, вы получите такую же оценку, как и в случае, если бы придерживались договоренности. Единственное отличие – все вы потратили на учебу больше времени, чем вам хотелось бы.
Это пример дилеммы заключенных[4]. В ее оригинальной версии двух подозреваемых допрашивают по отдельности и предлагают каждому признать свою вину. Одному из них, скажем, подозреваемому А, говорят следующее: «Если другой подозреваемый (Б) не сознается, то вы можете заключить выгодную сделку и смягчить наказание, признав свою вину. Но если Б сознается, тогда вам тоже лучше это сделать, иначе суд будет особенно суровым по отношению к вам. Так что вам следует сознаться в любом случае». Подозреваемого Б убеждают с помощью аналогичных доводов. Столкнувшись с таким выбором, А и Б сознаются, хотя для обоих было бы лучше, если бы они молчали, поскольку у полиции нет против них никаких веских доказательств.
В случае с оцениванием знаний складывается похожая ситуация. Если другие студенты будут работать меньше, то вы получите гораздо более высокий средний балл благодаря усердной учебе; если же другие будут усердно трудиться, тогда вам лучше делать то же самое, иначе вы получите низкий балл. Вы даже можете подумать, что слово «заключенный» очень уместно для обозначения группы студентов, попавших в ловушку обязательного учебного курса.
У преподавателей и учебных заведений собственная дилемма заключенных. Каждый преподаватель может сделать так, чтобы его курс выглядел привлекательно, оценивая знания студентов менее строго, а каждое учебное заведение может подыскать своим выпускникам более достойную работу или привлечь более перспективных абитуриентов, менее взыскательно оценивая знания студентов по всем курсам. Безусловно, если все так и поступят, ни у кого не будет преимущества перед остальными; единственное, что произойдет, – это стремительное повышение оценок, которое приводит к сжатию их диапазона, а значит, затрудняет возможность разграничивать способности студентов.
Люди часто думают, что в любой игре должны быть победитель и побежденный. Дилемма заключенных – это нечто иное: оба игрока (или все игроки) могут проиграть. Люди играют в такие игры (и проигрывают) каждый день, и проигрыши могут быть самыми разными, от небольших неудобств до потенциальных катастроф. Во время спортивных соревнований зрители поднимаются со своих мест, чтобы лучше все видеть, но когда все стоят, зона обзора, наоборот, сужается. Сверхдержавы накапливают больше оружия, чтобы получить преимущество перед противниками, но когда это делают обе стороны, соотношение сил не меняется, зато это приводит к нерациональному использованию экономических ресурсов, которые можно было бы направить на более достойные цели, чем вооружение, и повышению риска случайного развязывания войны. Учитывая величину возможных потерь всех участников таких игр, важно знать способы налаживания взаимовыгодного сотрудничества. Изучению подобной игры посвящена глава 10.