Мэтт Ридли - Происхождение альтруизма и добродетели. От инстинктов к сотрудничеству
Большинство скептиков упустили из виду главное. Критиковать Аксельрода за то, что он, видите ли, не сумел охватить все происходящее в мире равно критике Ньютона за то, что он не объяснил политику с точки зрения силы тяжести. Все думали, что дилемма заключенного преподает суровый, жестокий урок — единственным рациональным решением является предательство, и со стороны людей не понимать это просто глупо. А ведь, по сути, Аксельрод обнаружил, что «тень будущего» кардинально меняет ситуацию. Раз за разом на его турнирах побеждала простая, добропорядочная стратегия. Даже если созданные им условия позже оказались нереалистичными, даже если жизнь не похожа на турнир, результаты Аксельрода в пух и прах разбили рабочее допущение всех тех, кто изучал эту тему раньше. Нет, непорядочность — не единственное рациональное решение дилеммы заключенного. Финишировать первыми могут и хорошие парни.
Что же касается аргумента, будто «Око за око» выигрывает, потерпев поражение там, где оно приносит наибольшее количество очков, то в этом-то вся и суть. Эта стратегия уступает или заканчивает вничью отдельные битвы, зато выигрывает войну, заработав максимальное количество баллов. Она не завидует и не стремится «обойти» оппонента. Жизнь, верит она, это не игра с нулевой суммой, мой успех не зависит от твоего провала, мы оба можем «победить». «Око за око» расценивает каждую игру не как соревнование, а как сделку между участниками.
Ряд народов высокогорной центральной части Новой Гвинеи, живущих в мире опасных, нестабильных, но реципрокных альянсов и вечной вражды между племенами, недавно пристрастился к футболу. Однако, обнаружив, что поражение чересчур пагубно сказывается на кровяном давлении, слегка изменил правила: матч продолжается до тех пор, пока каждая из сторон не забьет определенное количество голов. Всем весело, проигравших нет, и каждый забивший мяч может считать себя победителем. Это не игра с нулевой суммой.
«Ну, как вы не понимаете? — восклицал после одного такого матча новоприбывший священник-рефери. — Цель игры — победить соперника. Кто-то обязательно должен выиграть!» «Нет, отец, — терпеливо отвечали капитаны команд. — Все не так. Только не здесь, не в Асмате. Если кто-то выиграет, значит, кто-то проиграет — а это никуда не годится»72.
Такие рассуждения кажутся, мягко говоря, странными. Но лишь потому, что нам инстинктивно трудно их понять — по крайней мере, в контексте игры (лично я сомневаюсь в прелестях новогвинейского футбола). Рассмотрим торговлю. Для экономистов обоюдная прибыль — аксиома. Если две страны расширяют торговлю, обеим лучше. И все же, обыватель — не говоря уж о его представителе-демагоге — видит это несколько иначе. Для него торговля это конкуренция: экспорт — хорошо, импорт — плохо.
Вообразите турнир по футболу, слегка отличающийся от новогвинейского. Пусть в этом соревновании победителем станет не тот, кто выиграл больше всего матчей, а тот, кто забил больше всех мячей. Теперь представьте, что несколько команд решили сыграть в нормальный футбол: то есть их основная задача — пропустить как можно меньше мячей и набрать как можно больше очков. Остальные участники пробуют иную стратегию: сначала позволяют соперникам забить гол, а потом стараются сделать это сами. По возможности оппоненты поступают так же, и так далее. Какие команды наиболее успешны, видно сразу: конечно, те, что используют стратегию «Око за око». Иными словами, из игры с нулевой суммой футбол превратился в игру с ненулевой суммой. Именно этого добился и Аксельрод: он превратил дилемму заключенного из игры с нулевой суммой в игру с ненулевой суммой. В жизни-то первая встречается очень редко.
В одном важном аспекте, однако, Бинмор и другие критики оказались правы. Аксельрод слишком поторопился, заключив, что сама стратегия «Око за око» является эволюционно стабильной — то есть популяция, применяющая ее, защищена от вторжения той, которая использует любую другую стратегию. Этот вывод опровергли дальнейшие компьютерные симуляционные соревнования, похожие на третий турнир Аксельрода. В ходе них Роб Бойд и Джеффри Лорбербаум показали, насколько легко создать условия, в которых «Око за око» не побеждает.
Эти турниры, напомню, подразумевают борьбу случайной комбинации стратегий друг против друга за контроль над ограниченным пространством — путем размножения со скоростью, определяемой количеством заработанных в предыдущей игре очков: 5, з, 1 или о. Наиболее успешными поначалу являются непорядочные («гадкие») — такие, как «Всегда предавай»: эксплуатируя наивные кооперативные стратегии, они постепенно вытесняют их. Но вскоре и они слабеют: встречаясь только друг с другом, они получают всего по одному очку, и на первый план выходит «Око за око». Играя против «Всегда предавай», она скоро тоже начинает предавать (тем самым лишая оппонента искушения ценой в пять очков), а играя против себя самой, сотрудничает и набирает по три балла. Выходит, пока стратегии «Око за око» могут найти себе подобных и сформировать пусть маленький, но кооперативный кластер, они будут процветать и, в конечном счете, доведут до вымирания «Всегда предавай»73.
Если стрелок ирландской республиканской армии, целясь в британского солдата, убивает невинного наблюдателя-протестанта, ошибка может привести к ответному убийству.
Но тут-то и проявляется слабое место «Око за око»: она подвержена ошибкам. Если вы помните, эта стратегия сотрудничает до тех пор, пока не столкнется с предательством, которое затем наказывает. Как правило, два игрока «Око за око» благополучно сотрудничают, но если один вдруг предает (по ошибке, по случайности), второй начинает мстить. В результате получается замкнутый круг чрезвычайно неприбыльного обоюдного предательства. Рассмотрим пример из реальной жизни. Если стрелок ирландской республиканской армии, целясь в британского солдата, убивает невинного наблюдателя-протестанта, ошибка может привести к ответному убийству лоялистом случайно выбранного католика. Тот, разумеется, тоже будет отомщен — и так далее до бесконечности. Подобные серии смертей в Северной Ирландии известны как убийства из мести — «око за око, зуб за зуб».
С учетом всех этих ограничений становится ясно, что успех стратегии «Око за око» в турнирах Аксельрода явно определялся формой их проведения. Она оказалась такова, что просто не выявились слабые места этой стратегии. В мире, где ошибки совершают все без исключения, стратегия «Око за око» — второсортная, уступающая всем остальным типам.
И вот ясные выводы Аксельрода заволокло облаками. И чем более изощренными были новые стратегии, тем сильнее сгущались тучи.
Введите Павлова
Перенесемся в Вену. Конец 1980-х годов. Карл Зигмунд, одаренный математик с весьма игривым складом ума, ведет семинар по теории игр. Один из присутствующих студентов, Мартин Новак, тут же решает бросить химию и полностью отдаться изучению данной темы. Зигмунд, приятно удивленный напором своего ученика, ставит перед ним нелегкую задачу: разобраться в дебрях сложностей, окруживших дилемму заключенного после появления стратегии «Око за око». Найдите мне идеальную стратегию в реалистичном мире, предложил Зигмунд.
Новак разработал собственный турнир: он отличался отсутствием какой бы то ни было определенности и был построен на статистике. Стратегии либо совершали случайные ошибки с определенной вероятностью, либо меняли тактики по тому же вероятностному принципу. Система, однако, могла «учиться» или развиваться, сохраняя улучшения и отказываясь от неудачных тактик. Постепенному эволюционному изменению подвергались даже те вероятности, с которыми совершались те или иные действия. Такой новый реализм оказался чрезвычайно полезен, ибо устранил все излишние усложнения. Вместо нескольких стратегий, в равной степени способных выиграть, четкое лидирующее положение занимала одна. И это была не «Око за око», а ее очень близкая родственница — «Великодушная око за око» (которую я для краткости буду называть просто «Великодушной»).
Эта стратегия иногда прощает единичные ошибки. Иными словами, примерно треть всего времени она прощает разовое предательство. Прощение всех единичных предательств — стратегия, известная как «Око за два ока» — подразумевает явную эксплуатацию. А вот прощение время от времени (примерно с 30-процентной вероятностью) оказалось на удивление эффективным: оно помогало разорвать циклы взаимных упреков, не подвергаясь при этом эксплуатации со стороны предателей. В компьютерной популяции игроков «Око за око», совершающих периодические ошибки, «Великодушная» будет распространяться за счет последних. Как это ни парадоксально, «Око за око» фактически, прокладывает дорогу стратегии, более доброй, чем она сама. Это Иоанн Креститель, а не сам Мессия.