Алекс в стране чисел. Необычайное путешествие в волшебный мир математики - Беллос Алекс
Первым, кто осознал закономерность, проявляемую подобными ошибками измерений, был знаменитый немецкий математик Карл Фридрих Гаусс (1777–1855). Закономерность описывается следующей колоколообразной кривой:
Гауссовский график требует некоторых пояснений. Горизонтальная ось изображает некоторый набор исходов, например вес багета или угловое расстояние между звездами. Вертикальная ось показывает вероятности этих исходов. Кривая, построенная на осях с такими параметрами, называется распределением. Она показывает разброс исходов и то, насколько вероятен каждый из них.
Имеется множество различных типов распределений, но самый главный тип описывается именно приведенной выше кривой. Колоколообразная кривая известна также как нормальное распределение, или гауссово распределение. Исходно оно называлось кривой ошибок, но из-за ее отличительной формы больше привился термин колоколообразная кривая. У колоколообразной кривой есть среднее значение, которое отмечено буквой X. Среднее — это наиболее вероятный исход. Чем дальше вы уходите от среднего, тем менее вероятны соответствующие исходы.
Когда измеряется некая величина и процесс подвержен случайным ошибкам, результат, как правило, одним и тем же не получается. Однако чем больше делается измерений, тем сильнее распределение исходов начинает напоминать колоколообразную кривую; другими словами, исходы симметрично группируются вокруг среднего значения. Конечно, график, выражающий результаты измерений, будет не непрерывной кривой, а (как в случае с моими багетами), ломаной линией, проходящей через фиксированные точки. Колоколообразная кривая — это теоретический предел того, как ведут себя случайные ошибки. Чем больший объем данных собран, тем лучше ломаная линия ложится на эту кривую.
В конце XIX столетия другой выдающийся математик — француз Анри Пуанкаре (1854–1912) понял, что распределение исходов, подверженных случайным ошибкам измерения, аппроксимируется колоколообразной кривой. Пуанкаре на самом деле провел тот же «хлебный» эксперимент, что и я, но совсем по другой причине. Он подозревал, что булочник обманывает его, продавая хлеб заниженного веса, и решил с помощью математики вывести мошенника на чистую воду. Каждый день в течение года Пуанкаре взвешивал купленную килограммовую буханку хлеба. Пуанкаре знал, что если вес несколько раз окажется ниже 1 килограмма, то это еще не свидетельство злонамеренности булочника, поскольку следует ожидать, что вес будет колебаться, оказываясь то несколько выше, то несколько ниже указанного килограмма. И он предположил, что график, отражающий вес хлеба, будет напоминать нормальное распределение, поскольку ошибки, неизбежно закрадывающиеся при изготовлении хлеба (количество использованной муки или продолжительность выпечки), носят случайный характер.
Спустя год он рассмотрел все собранные им данные. Распределение весов очень неплохо аппроксимировало колоколообразную кривую. Однако пик кривой пришелся на 950 граммов. Другими словами, средний вес буханки был равен 0,950 килограмма, а не 1 килограмму, как объявлялось. Подозрения, мучавшие Пуанкаре, подтвердились. Знаменитого ученого обманывали в среднем на 50 граммов на каждой буханке. Согласно распространенной легенде, Пуанкаре известил парижскую полицию, и пекарь получил строгое предупреждение.
Добившись этой небольшой победы в борьбе за права потребителей, Пуанкаре не остановился на достигнутом. Он продолжал каждый день взвешивать хлеб, и еще через год обнаружил, что форма графика не описывается правильной колоколообразной кривой; оказалось, кривая скошена направо. Поскольку он знал, что полностью случайная ошибка приводит к правильной колоколообразной кривой, он заключил, что на вес продаваемого хлеба влияет какой-то неслучайный фактор. По-видимому, решил Пуанкаре, пекарь не прекратил хитрить, недовешивая хлеб. Просто каждый раз мошенник продавал Пуанкаре — с которым, как он считал, лучше было не связываться — самый большой хлеб из имевшихся, тем самым внося в распределение систематическую ошибку.
К несчастью для булочника, его покупатель был одним из умнейших людей во всей Франции. Пуанкаре снова информировал полицию.
Способ, который применил тогда Пуанкаре, был поистине провидческим; в наше время он составляет теоретическую основу защиты прав потребителей. Когда магазины продают продукты заявленного веса, по закону эти продукты не обязаны иметь в точности этот вес — такого и быть не может, потому что в процессе производства неизбежно некоторые изделия оказываются немного тяжелее, а некоторые — немного легче. Работа служащих, следящих за соблюдением стандартов в торговле, состоит в случайной выборке образцов продукта, доступного в продаже, и построении графика, показывающего вес. Для всякого продукта, подвергающегося такой процедуре, распределение весов должно укладываться на колоколообразную кривую с центром на заявленном значении.
* * *За полвека до того, как Пуанкаре занялся укладкой веса хлеба на колоколообразную кривую, другой математик видел эту кривую повсюду и во всем. Бельгиец Адольф Кетле (1796–1874) был по образованию геометром и астрономом, но интересовало его совсем иное — его увлекали массивы данных, а точнее говоря, нахождение закономерностей в цифрах. В одной из своих первых работ Кетле исследовал французскую национальную статистику преступлений, которую правительство начало публиковать в 1825 году. Ученый заметил, что число убийств год от года практически не менялось. Даже частота использования различных видов орудий убийства — было ли оно произведено с помощью ружья, сабли, ножа, кулака и т. д. — оставалась, в грубом приближении, той же самой. В наши дни это не вызывает особого интереса — и в самом деле, вся система функционирования общественных институтов основана на использовании, например, частоты преступлений, частоты прохождения экзамена и частоты несчастных случаев, от которых мы и в самом деле ожидаем постоянства, — но Кетле был первым, кто обратил внимание на потрясающую регулярность социальных явлений. На каждый данный год появлялась возможность с достаточной точностью предсказать количество будущих убийств. Из такого рода закономерностей возникала совсем иная трактовка личной ответственности и справедливости наказания. Ведь если общество подобно машине, вырабатывающей заданное число убийств, то не означает ли это, что вся вина лежит скорее на обществе, чем на индивидууме-преступнике?
Работы Кетле привели к тому, что слово статистика изменило свое значение. Исходно оно не имело отношения к числам, а использовалось для описаний общих фактов о государстве, вроде той информации, которая нужна государственным деятелям. Кетле превратил статистику в гораздо более широкую дисциплину, в меньшей степени имеющую отношение к делам государства, а в большей — к математике коллективного поведения. Едва ли он сильно преуспел бы на этом поприще, если бы не параллельное бурное развитие теории вероятностей, которая предоставляла методы для анализа случайных данных. В 1853 году Кетле организовал в Брюсселе первую международную конференцию по статистике.
Глубокие наблюдения Кетле, касающиеся коллективного поведения, оказали большое влияние и на другие области знания. Коль скоро изучение данных о народонаселении позволяло проследить устойчивые тенденции, требовался лишь небольшой толчок, чтобы осознать, что, например, в поведении атомного «населения» также имеются предсказуемые закономерности. Джеймс Клерк Максвелл и Людвиг Больцман воспользовались многими «статистическими» идеями Кетле и предложили кинетическую теорию газов, согласно которой давление газа определяется столкновениями его молекул, летящих в случайных направлениях с различными скоростями. Хотя скорость каждой отдельной молекулы узнать нельзя, в целом молекулы ведут себя предсказуемым образом. Происхождение кинетической теории газов — интересное исключение из общего правила, согласно которому прогресс в социальных науках основан на достижениях в науках естественных. В данном случае знание перетекало в обратном направлении.