Авинаш Диксит - Стратегические игры. Доступный учебник по теории игр
Однако в этом анализе не учтена проблема зависимости. Как только Кармен попробует какое-то время курить, у нее сформируются другие вкусы и изменятся выигрыши. Решение о том, продолжать ли курить, будет принимать уже не нынешняя Кармен с ее теперешней оценкой исходов игры в том виде, как показано на рис. 3.2, а будущая Кармен, которая иначе оценит дальнейшие альтернативы. Делая выбор сегодня, Кармен нужно проанализировать его последствия и учесть это в своем решении, которое она должна принять исходя из текущих предпочтений. Другими словами, проблема выбора, касающаяся курения, – на самом деле не решение в том смысле, о котором шла речь в главе 2 (выбор, сделанный в нейтральной среде), а игра в формальном смысле, также представленная в главе 2, в которой другой игрок – это будущее «я» Кармен со своими особыми приоритетами. И нынешней Кармен при принятии решения предстоит вести игру с будущей Кармен.
Мы превратим дерево решений, представленное на рис. 3.2, в дерево игры на рис. 3.3 посредством введения двух игроков, делающих выбор в двух узлах. В начальном узле нынешняя Кармен решает, стоит ли ей пробовать курить. В случае положительного ответа появляется будущая Кармен, попавшая в зависимость от курения, и уже она решает, продолжать ей курить или нет. Давайте изобразим здоровую, не загрязняющую окружающую среду нынешнюю Кармен, ее действия и выигрыши серым цветом, а пристрастившуюся к курению будущую Кармен, ее действия и выигрыши – черным (такими стали ее легкие). Выигрыши нынешней Кармен остались прежними. А вот будущая Кармен продолжит наслаждаться курением, а при попытке бросить у нее наступит ужасный абстинентный синдром. Пусть выигрыш будущей Кармен при выборе варианта «курить» составляет +1, а при выборе «не курить» – −1.
.
Рис. 3.3. Игра «курение»
Учитывая предпочтения будущей курильщицы Кармен, в узле принятия решений она выберет вариант «продолжать». Нынешняя Кармен должна проанализировать эту перспективу и учесть ее при принятии текущего решения, признав, что если перевесит желание покурить, то это неизбежно приведет к тому, что она будет курить и впоследствии. Несмотря на то что нынешняя Кармен этого не хочет, она не сможет в дальнейшем реализовать свой текущий выбор, поскольку будущая Кармен, у которой совсем иные наклонности, сделает именно такой выбор. Следовательно, нынешняя Кармен должна предвидеть, что выбор варианта «попробовать» приведет к выбору «продолжать» и обеспечит ей выигрыш −1 по ее текущим оценкам, тогда как выбор варианта «нет» даст выигрыш 0. Таким образом, ей следует предпочесть второе.
Подобная аргументация более наглядно представлена на рис. 3.4. На рис. 3.4а мы обрезаем, или отсекаем, ветвь «нет», исходящую из второго узла. Такое отсекание говорит о том, что будущая Кармен, которая делает выбор в этом узле, не выберет действие, соответствующее этой ветви, учитывая ее предпочтения, выделенные черным цветом.
.
.
Рис. 3.4. Отсечение ветвей дерева игры «курение»
На дереве остались две ветви, исходящие из первого узла, в котором делает выбор нынешняя Кармен; каждая из ветвей ведет непосредственно к концевому узлу. Такое отсечение позволяет нынешней Кармен просчитать все возможные последствия любого своего решения. Выбор варианта «попробовать» приведет к варианту «продолжать» и обеспечит выигрыш −1 с точки зрения предпочтений нынешней Кармен, тогда как выбор варианта «нет» даст выигрыш 0. Таким образом, на данный момент Кармен должна выбрать вариант «нет», а не «попробовать». Следовательно, мы можем отсечь ветвь «попробовать», исходящую из первого узла (вместе с ее предполагаемым продолжением), как показано на рис. 3.4б. На нем изображено «полностью усеченное» дерево всего с одной ветвью, исходящей из начального узла и ведущей к концевому. Единственный оставшийся путь, пролегающий по дереву игры, демонстрирует, что произойдет в игре, если все ее участники сделают лучший выбор на основании правильного прогнозирования всех вероятных исходов.
При обрезке ветвей дерева игры на рис. 3.4 мы вычеркнули ветви, которые не выбрали. Еще один эквивалентный, но альтернативный способ показать выбор игрока – как-то выделить выбираемые им ветви. Для этого можно отметить их галочками или стрелками или выделить более жирными линиями. Подойдет любой способ (на рис. 3.5 показаны все перечисленные варианты[21]), вам виднее, но все же второй вариант, особенно выделение стрелками, имеет свои преимущества. Во-первых, он обеспечивает формирование более четкой картины происходящего. Во-вторых, в случае вычеркивания ветвей не всегда понятен порядок их отсечения. Например, на рис. 3.4б читатель может подумать, что ветвь «продолжать», исходящая из второго узла, была отсечена первой, а уже после этого была отсечена ветвь «попробовать» в первом узле и следующая за ней ветвь «нет» во втором узле. Последний и самый важный аргумент в пользу этого способа состоит в том, что стрелки более наглядно показывают результат последовательности оптимальных вариантов выбора в виде непрерывной цепочки стрелок от начального до концевого узла. Вот почему в других диаграммах такого типа, представленных далее в книге, мы используем стрелки вместо вычеркивания ветвей. В процессе построения деревьев игр вам следует попрактиковаться в применении обоих способов, а когда научитесь строить такие деревья, можете выбрать тот способ, который вам больше нравится.
.
Рис. 3.5. Выбор ветвей на дереве игры «курение»
Независимо от того, как вы отобразите свои размышления на дереве игры, логика анализа во всех случаях будет одинаковой и важной. Вы должны начать с рассмотрения узлов действий, ведущих непосредственно к концевым узлам. Оптимальный выбор для игрока, делающего ход в таком узле, можно определить путем сравнения его выигрышей в соответствующих концевых узлах. Использование вариантов выбора в конце игры для прогнозирования последствий более ранних действий позволяет рассчитать выбор в узлах, предшествующих узлам окончательного принятия решений. Затем то же самое можно сделать с предыдущими узлами и т. д. Передвигаясь таким образом по дереву игры в обратном направлении, вы можете решить всю игру.
Данный метод определения поведения в игре с последовательными ходами (смотреть вперед и рассуждать в обратном порядке) известен как метод обратных рассуждений. Как подразумевает само его название, сперва следует подумать, что произойдет во всех концевых узлах, а затем передвигаться по дереву в обратном направлении вплоть до начального узла, анализируя соответствующие действия. Поскольку такие рассуждения требуют передвижения в обратном направлении по одному шагу за один раз, этот метод обозначают также термином «обратная индукция». Мы предпочитаем термин «обратные рассуждения», ввиду того что он проще и получает все более широкое распространение, однако в других книгах по теории игр используется старый термин «обратная индукция». Вам следует просто запомнить, что они эквивалентны.
Когда все участники игры для выбора оптимальных стратегий применяют метод обратных рассуждений, такая совокупность стратегий в данной игре называется равновесием обратных рассуждений, а исход игры, обусловленный использованием этих стратегий, – исходом равновесия обратных рассуждений. В более сложных учебниках по теории игр эта концепция обозначается как совершенное равновесие подыгры; возможно, ваш преподаватель предпочитает именно этот термин. Мы приводим формальное объяснение и анализ совершенного равновесия подыгры в главе 6, но склоняемся к употреблению более простого и интуитивно понятного термина «равновесие обратных рассуждений». Теория игр предсказывает такой исход в качестве равновесия в игре с последовательными ходами, в которой все игроки становятся рациональными вычислителями в погоне за максимальным выигрышем. Далее в данной главе мы проанализируем, как этот прогноз подтверждается на практике. А пока вам следует знать, что во всех конечных играх с последовательными ходами, представленных в этой книге, есть по крайней мере одно равновесие обратных рассуждений. В действительности в большинстве игр присутствует в точности одно такое равновесие. И только в исключительных случаях, когда игрок получает одинаковые выигрыши в результате двух или более наборов ходов, а значит, не может отдать явное предпочтение ни одному из них, их может быть больше.
В игре «курение» равновесие обратных рассуждений наблюдается в случае, когда нынешняя Кармен выбирает стратегию «нет», а будущая Кармен – стратегию «продолжить». Когда нынешняя Кармен совершает оптимальное действие, пристрастившаяся к курению будущая Кармен вообще не появляется на свет, а значит, и не получает реальной возможности сделать ход. Однако призрачное присутствие будущей Кармен и стратегия, которую бы она предпочла, если бы нынешняя Кармен выбрала вариант «попробовать» и предоставила бы ей шанс сделать ход, – важный элемент игры, на самом деле являющийся ключевым в определении оптимального хода нынешней Кармен.