Ричард Докинз - Эгоистичный ген
Рассмотрим теперь еще одну стратегию, получившую название Раскаивающийся испытатель. Раскаивающийся испытатель сходен с Наивным испытателем, отличаясь от него лишь тем, что для запуска серии поочередных возмездии необходимо предпринимать активные шаги. Для этого ему нужна несколько более долгая «память», чем у стратегий Око за око или Наивный испытатель. Раскаивающийся испытатель запоминает, был ли его отказ спонтанным и привело ли это к быстрому возмездию. В этом случае он, «полный раскаяния», предоставляет своему противнику право на «один бесплатный удар», за которым не следует возмездия. Это означает, что серии взаимных возмездии пресекаются и самом зачатке. Если теперь продолжить воображаемую игру между стратегиями Раскаивающийся испытатель и Око за око, то обнаружится, что серии мнимых взаимных возмездии быстро прерываются. На протяжении большей части игры противники взаимно кооперируются, что обеспечивает им обоим большой выигрыш. Раскаивающийся испытатель играет более успешно против стратегии Око за око, чем Наивный испытатель, хотя и не так успешно, как Око за око против самой себя.
Некоторые из стратегий, участвовавших в турнире Аксельрода, были гораздо более хитроумными, чем Раскаивающийся испытатель или Наивный испытатель, однако они также набирали в среднем меньше очков, чем простая стратегия Око за око. В сущности наименее успешной из всех стратегий (если исключить Случайную) оказалась самая сложная, тщательно разработанная стратегия. Она была представлена под девизом «Автор пожелал остаться неизвестным», что послужило поводом для веселых гипотез. Кто автор? Какой-то серый кардинал в Пентагоне? Глава ЦРУ? Генри Киссинджер? Сам Аксельрод? Я думаю, что этого мы никогда не узнаем.
Подробно разбирать отдельные стратегии не так уж интересно. В задачи этой книги не входит обсуждение изобретательности программистов. Гораздо интереснее распределить имеющиеся стратегии по определенным категориям и изучать эффективность этих более крупных подразделений. Самая важная из различаемых Аксельродом категорий названа «добропорядочной». Добропорядочная стратегия определяется как такая стратегия, которая никогда не отказывается первой. Примером служит Око за око. Она способна отказаться, но делает это только в порядке возмездия. Как Наивный, так и Раскаивающийся испытатели — недобропорядочные стратегии, потому что они иногда, хотя и редко, отказываются без всякого к тому повода. Из 15 стратегий, участвовавших в турнире, 8 были добропорядочными. Показательно, что эти же 8 стратегий набрали наибольшее число очков, а 7 недобропорядочных остались далеко позади. Стратегия Око за око набрала в среднем 504,5 очка, что составляет 84% от нашей точки отсчета (600 очков) и может считаться хорошим результатом. Другие добропорядочные стратегии набрали лишь немного меньше очков — от 83,4 до 78,6%, оставив далеко позади самую успешную из всех непорядочных стратегий — Грааскамп, набравшую 66,8% очков.
Еще один из технических терминов Аксельрода — это «прощение». У прощающей стратегии короткая память, хотя она может давать сдачи. Она очень быстро забывает о прошлых обидах. Око за око — прощающая стратегия. Она немедленно дает отказчику по рукам, но тут же забывает о нанесенной ей обиде. Описанный в гл. 10 Злопамятный никогда не прощает. Он сохраняет в памяти все события до самого конца игры. Он никогда не забывает, если кто-то из игроков хотя бы один раз сыграл против него Отказываюсь. Стратегия, формально названная Злопамятный, участвовала в турнире Аксельрода под именем Фридман и не достигла особенно хороших результатов. Среди всех добропорядочных стратегий (заметим, что она добропорядочна лишь в техническом смысле, но при этом совершенно ничего не прощает) пара Злопамятный/Фридман оказалась на втором месте с конца. Причина, по которой неспособные прощать стратегии не достигают хороших результатов, состоит в том, что они не могут разорвать серию взаимных возмездии даже в тех случаях, когда их противник «раскаивается».
Можно быть более снисходительным, чем стратегия Око за око. Стратегия Око за два ока разрешает своим противникам два отказа подряд и только потом мстит. Это может показаться слишком милостивым и великодушным. Тем не менее Аксельрод установил, что если бы кто-то представил на рассмотрение стратегию Око за два ока, то она победила бы в турнире. Это обусловлено способностью данной стратегии избегать серии взаимных возмездии.
Таким образом, мы определили два качества выигрывающих стратегий: добропорядочность и способность к прощению. Это почти утопическое заключение, что добропорядочность и всепрощение окупаются, вызвало удивление у многих экспертов, которые пускались на всевозможные хитрости, предлагая стратегии, содержащие в себе скрытые элементы недобропорядочности; даже те, кто предложил добропорядочные стратегии, не решились на что-либо столь всепрощающее, как Око за два ока.
Аксельрод объявил о втором турнире. Он получил 62 заявки на участие и снова добавил к ним Случайную стратегию, что в сумме составило 63 стратегии. На этот раз по причине, о которой я скажу позднее, точное число ходов за партию — 200 — не было оговорено заранее. Мы снова можем выражать в процентах оценки от точки отсчета или же от результатов, получаемых при условии «Всегда кооперируйся», несмотря на то, что определение этой точки отсчета требует более сложных вычислений и она уже не всегда равна 600 очкам.
Всем программистам, участвовавшим во втором турнире, были представлены результаты первого турнира, а также проведенный Аксельродом анализ того, почему Око за око и другие добропорядочные и способные к прощению стратегии получили такие хорошие результаты. Разумеется, участники турнира тем или иным образом должны были учесть эту информацию. На самом деле они разбились на две группы. Одни считали, что добропорядочность и способность к прощению, очевидно, давали шансы на выигрыш, и соответственно предложили добропорядочные способные к прощению стратегии. Джон Мэйнард Смит зашел так далеко, что представил всепрощающую стратегию Око за два ока. Другая группа исходила из того, что многие участники, прочитав анализ Аксельрода, предложат теперь добропорядочные способные к прощению стратегии. Они поэтому представили недобропорядочные стратегии, пытаясь использовать в своих интересах этих предполагаемых придурков!
Однако недобропорядочность опять оказалась невыгодной. Снова стратегия Око за око, представленная Анатолем Раппопортом, вышла победителем, и результат составил целых 96% от 600. И еще раз добропорядочные стратегии в общем оказались более эффективными, чем непорядочные. Все 15 более эффективных стратегий, за исключением одной, были добропорядочными, а из 15, набравших меньше очков, все, за исключением одной, были непорядочными. Но хотя праведная стратегия Око за два ока выиграла бы в первом турнире, если бы в нем участвовала, она не вышла победителем из второго. Это объясняется тем, что во втором турнире участвовали более коварные стратегии, способные безжалостно наброситься на столь откровенного придурка.
Такой результат выявил одно важное обстоятельство, характерное для этих турниров: успех той или иной стратегии зависит от того, какие другие стратегии участвуют в турнире. Это единственный способ объяснить различие между вторым турниром, в котором Око за два ока заняла гораздо более далекое место в турнирной таблице, и первым турниром, в котором эта стратегия выиграла бы. Однако, как я уже говорил, эта книга не о том, сколь изобретательны программисты. Существует ли способ, позволяющий решить, какую стратегию можно действительно считать наилучшей в более общем и менее произвольном смысле? Те, кто прочитали предыдущие главы, уже готовы искать ответ на этот вопрос в теории эволюционно стабильных стратегий.
Я был одним из тех, кому Аксельрод сообщил о своих ранних результатах с просьбой прислать стратегию для второго турнира. Я этого не сделал, но высказал другое предложение. Аксельрод уже начинал мыслить в терминах ЭСС, но я счел это столь важным, что написал ему, предложив связаться с У. Гамильтоном. Аксельрод не знал, что Гамильтон в это время работал в одном с ним университете, только в другом отделении. Он немедленно встретился с ним, и результатом последовавшего за этим сотрудничества оказалась блестящая статья, опубликованная в журнале Science в 1981 г. и завоевавшая премию Ньюкомба Кливленда Американской ассоциации содействия развитию науки. Помимо обсуждения некоторых восхитительно оторванных от жизни биологических примеров Итерированных Парадоксов заключенных, Аксельрод и Гамильтон дали, с моей точки зрения, должную оценку подходу в свете теории ЭСС.
Сопоставьте этот подход с «соревнованием по круговой системе», в соответствии с которым проводились два турнира Аксельрода. Каждая стратегия выставлялась против каждой из других стратегий одинаковое число раз. Конечная оценка стратегии определялась общей суммой очков, «заработанных» ею в играх со всеми остальными стратегиями. Таким образом, чтобы добиться успеха в соревновании по круговой системе, данная стратегия должна выстоять против всех других стратегий, которые людям вздумается предложить. Аксельрод назвал стратегию, способную победить широкий круг других стратегий, «сильной» стратегией. Око за око оказалась сильной стратегией. Однако набор стратегий, предлагаемых людьми в том или другом случае, произволен. Именно это беспокоило нас выше. По чистой случайности в первом турнире Аксельрода примерно половина стратегий относилась к добропорядочным. В этих условиях Око за око выиграла, а Око за два ока выиграла бы, если бы приняла участие в турнире. Допустим, однако, что все представленные стратегии случайно оказались непорядочными. Такая ситуация могла бы возникнуть очень легко. Ведь из 14 предложенных стратегий 6 действительно были непорядочными. Если бы число непорядочных стратегий составило 13, то Око за око не выиграла бы. Атмосфера оказалась бы для нее неподходящей. Не только сумма выигрыша, но и место в иерархическом ряду, выстраиваемом на основе достигнутого успеха, определяется тем, какие стратегии были представлены; иным словами, все зависит от такого произвольного фактора, как прихоть того или иного человека. Как мы можем уменьшить эту произвольность? Если будем «мыслить в духе ЭСС».