Нассим Талеб - Чёрный лебедь. Под знаком непредсказуемости
К сожалению, занятия наукой из бескорыстной любви к знанию не гарантируют, что ты будешь двигаться в правильном направлении. Познакомившись с "нормальным" распределением, Гальтон влюбился в него. Говорят, он однажды воскликнул, что, если бы грекам было о нем известно, они бы обожествили его. Возможно, восторг Гальтона тоже поспособствовал воцарению гауссианы в научных умах.
Гальтон не сподобился обзавестись надлежащим математическим багажом, но был прямо-таки одержим измерениями. Он не знал о законе больших чисел, но сам открыл его, проанализировав собранные данные. Он сконструировал доску Гальтона, или "quincunx"[75], — что-то вроде автомата для игры в пинбол, с помощью которого можно смоделировать колоколовидную кривую, — об этом я расскажу через несколько абзацев. Правда, Гальтон применял кривую нормального распределения в таких областях, как генетика и наследственность, где ее использование оправданно. Но его энтузиазм помог внедрить зарождавшиеся статистические методы в социальные сферы.
Ответьте, пожалуйста, "да" или "нет"А сейчас позвольте мне поговорить о размерах ущерба.
Если вам нужны качественные (а не количественные) выводы, как в психологии или медицине, где вы вполне обойдетесь "безразмерными" ответами "да" или "нет", то можете спокойно допустить, что находитесь в Среднестане. Влияние невероятного не будет слишком большим. У него есть рак либо нет; она беременна либо нет и так далее. Смертельность или беременность не имеют степеней (если не рассматривать их в эпидемических масштабах). Но, когда вы манипулируете совокупностями, различными по величине (такими как доход, ваш капитал, прибыль с портфеля ценных бумаг или продажи книг), гауссиана может вас здорово подвести, так как эта сфера не в ее компетенции. Одно-единственное число способно порушить все ваши средние показатели; одна-единственная потеря — зачеркнуть сотни и сотни прибылей. Уже нельзя говорить: "Это исключение". Заявление "да, я могу потерять деньги" довольно бессмысленно, если не указать хотя бы приблизительную сумму. Потерять весь свой капитал или потерять долю своего дневного дохода — все-таки разница.
Именно поэтому эмпирическая психология и открытые ею свойства человеческой природы, о которых я говорил в начале этой книги, не страдают от ложного использования гауссианы; психологам вообще повезло, ибо переменные, которыми они оперируют, в большинстве своем не выходят за рамки обычной гауссовой статистики. Выясняя, сколько человек в выборке имеют определенную особенность или склонность к ошибке, они обычно добиваются результата посредством ответов "да" или "нет". Ни одно отдельно взятое наблюдение не может в корне изменить общего заключения.
Теперь я представлю вам идею гауссианы, разобрав ее по кирпичикам.
МЫСЛЕННЫЙ (ЧИСЛЕННЫЙ) ЭКСПЕРИМЕНТ, ДЕМОНСТРИРУЮЩИЙ, ОТКУДА ПРОИСХОДИТ КРИВАЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯРассмотрим своего рода пинбольный автомат, такой, как на рисунке 8. Запустим 32 шара, предполагая, что доска правильно сбалансирована, так что у шара одинаковые шансы свалиться направо и налево на любом пересечении, наткнувшись на штырь. Ожидаемый результат — большая часть шаров "приземлится" в центральных ячейках: чем ячейки дальше от центра, тем меньше туда попадет шаров.
Затем проведем мысленный эксперимент. Человек бросает монетку, смотрит, что выпало, орел или решка, и в зависимости от этого делает шаг влево или вправо. Это так называемое "случайное блуждание" не обязательно связано с ходьбой. С таким же успехом можно представить, что вместо шага вправо или влево вы каждый раз выигрываете или проигрываете доллар, при этом ведя учет долларам, накопившимся у вас в кармане.
Предположим, я заключаю с вами честное пари, где возможность выигрыша у вас примерно та же, что и проигрыша. Кидаем монетку. Орел — вы получаете доллар, решка — теряете доллар.
При первом броске вы либо выиграете, либо проиграете.
При втором броске число возможных исходов удваивается. Вариант 1: выигрыш-выигрыш. Вариант 2: выигрыш-проигрыш. Вариант 3: проигрыш-выигрыш. Вариант 4: проигрыш-проигрыш. У каждого из этих вариантов одинаковые шансы, комбинация из одного выигрыша и одного проигрыша встречается вдвое чаще, так как варианты 2 и 3, выигрыш-проигрыш и проигрыш-выигрыш, приводят к одинаковому результату. И в этом ключ к гауссиане. В середине очень многое сглаживается, и, как мы увидим, к середине тяготеет большинство. Поэтому если при каждом броске разыгрывается доллар, то на втором броске ваши шансы таковы: 25 процентов, что вы приобретете или потеряете 2 доллара, и 50 процентов, что выйдете в нуль.
Третий бросок снова удваивает число исходов, так что их становится восемь. Вариант 1 (выигрыш-выигрыш после двух бросков) разветвляется на выигрыш-выигрыш-выигрыш и выигрыш-выигрыш-проигрыш. Мы добавляем выигрыш или проигрыш к каждому из предыдущих результатов. Вариант 2 разветвляется на выигрыш-проигрыш-выигрыш и выигрыш-проигрыш-проигрыш. Вариант з разветвляется на проигрыш- выигрыш-выигрыш и проигрыш-выигрыш-проигрыш. Вариант 4 разветвляется на проигрыш-проигрыш-выигрыш и проигрыш-проигрыш-проигрыш.
Теперь у нас восемь вариантов, все одинаково вероятные. Заметим, что снова можно сгруппировать средние исходы, в которых выигрыш перечеркивает проигрыш. (На доске Гальтона ситуации, когда шар отлетает влево, а затем вправо, или наоборот, преобладают, так что в результате в середине оказывается много шаров.)
Совокупный итог таков: 1) три выигрыша; 2) два выигрыша, один проигрыш, итого один выигрыш; з) два выигрыша, один проигрыш, итого один выигрыш; 4) один выигрыш, два проигрыша, итого один проигрыш; 5) два выигрыша, один проигрыш, итого один выигрыш; 6) два проигрыша, один выигрыш, итого один проигрыш; 7) два проигрыша, один выигрыш, итого один проигрыш; и, наконец, 8) три проигрыша.
Из восьми вариантов вариант трех выигрышей встречается однажды. Вариант трех проигрышей встречается однажды. Вариант одного итогового проигрыша (один выигрыш, два проигрыша) встречается три раза. Вариант одного итогового выигрыша (один проигрыш, два выигрыша) встречается три раза.
Сделаем еще один бросок, четвертый. Будет шестнадцать равновероятных исходов. Один вариант четырех выигрышей, один вариант четырех проигрышей, четыре варианта двух выигрышей, четыре варианта двух проигрышей и шесть вариантов выхода в нуль.
"Quincunx" (это латинское производное от числительного "пять") в нашем пинбольном примере представляет собой иллюстрацию пятого броска или шага, после которого шансы, как легко высчитать, возрастают до шестидесяти четырех. Вот идея, воплощенная в доске Фрэнсиса Гальтона. Гальтону явно недоставало здоровой лени и математической сметки: вместо того чтобы сооружать такое устройство, вообще-то проще было поработать с алгеброй или провести мысленный эксперимент вроде нашего.
Однако продолжим игру до сорокового броска. На это уйдет лишь несколько минут, но понадобится калькулятор, чтобы вычислить количество исходов, так как наши мозги с этим не справятся. Получится 1 099 511 627 776 возможных комбинаций — то есть более тысячи миллиардов. Не затрудняйтесь просчитывать шаг за шагом — это будет два в сороковой степени, так как на каждом этапе каждая цепочка раздваивается. (Вспомните, как мы добавили выигрыш и проигрыш к вариантам третьего броска, удвоив число вариантов.) Из этих комбинаций только одна будет состоять из сорока выигрышей и только одна — из сорока проигрышей. Остальные будут тяготеть к середине, в данном случае — к нулю.
Вам уже ясно, что этот тип случайности чрезвычайно беден крайностями. Все сорок бросков оказываются выигрышными лишь в одном случае из 1 099 511 627 776. Если вы станете час за часом проделывать это упражнение с сорока бросками, вам придется здорово попотеть, прежде чем выпадут сорок орлов (или сорок решек) подряд. Поскольку вы наверняка будете прерываться, чтобы поесть, поспорить с друзьями и соседями, попить пива и поспать, то готовьтесь, ради такой удачи, прожить около четырех миллионов жизней. А представьте, что вы добавляете один лишний бросок. Чтобы выкинуть орла сорок один раз подряд, понадобится потратить на попытки восемь миллионов жизней! Переход от 40 к 41 уменьшает шансы вдвое. Это — ключевое свойство немасштабируемого подхода к анализу случайности: крайние отклонения убывают с все возрастающей скоростью. А пятьдесят орлов подряд могут выпасть один-единственный раз на протяжении 4 миллиардов жизней!