Искусство большего. Как математика создала цивилизацию - Майкл Брукс
Учитывая, что мы знаем об Исааке Ньютоне, несложно представить, в какую неистовую ярость он пришел, когда в 1710 году жюри сообщило, что отчеканенные монеты на одну тысячную долю отклонились от стандарта в меньшую сторону. Ньютон же полагал, что под его руководством монетный двор стал чеканить монеты “с гораздо большей точностью, чем когда-либо прежде”[196].
Из-за громких протестов Ньютона мастера золотых дел выставили его из церемониального зала. Не желая сдавать позиций, тот отправился в лабораторию, вооружившись ручкой и бумагой, и не переставал трудиться, пока не понял, в чем их ошибка. Проблема была в дефектной “проверочной пластине” – изготовленном из золотого сплава эталоне сравнения, который заменили в том году.
Объяснив ошибку в производстве проверочной пластины, которая привела к его отставке, Ньютон предложил реформировать протокол пробировки монет. Он сказал, что монетный двор должен заменить проверочную пластину на пластину из чистого золота. Его идею не приняли. Но через сто пятьдесят лет чиновники монетного двора признали предложение Ньютона дельным. Спустя целых сто тридцать три года с его погребения в Вестминстерском аббатстве его инновацию все же внедрили. Да, он был сварлив, но у нас ушло больше века, чтобы наконец воспользоваться его мудростью.
Guinness и t-критерий Стьюдента
Статистической инновацией, связанной с семплированием, также объясняется успех Guinness – одного из наиболее преуспевающих мировых брендов XX века. И здесь вышло особенно удачно: в стремлении улучшить свой стаут пивоварня Guinness подарила нам один из самых широко используемых статистических инструментов.
Когда в 1899 году Уильям Сили Госсет пришел работать на завод Guinness, он стал одним из шести человек в только что основанном в компании отделе научного пивоварения[197]. Его коллегами были химики, с отличием окончившие либо Оксфорд, либо Кембридж, и относились к ним как к настоящим звездам. Их поселили в доме Guinness. Сотрудникам ниже рангом говорили, что если им повезет встретить в коридоре одного из пивоваров, то следует опустить глаза и не поднимать их, пока он не пройдет мимо.
Предприятие недавно расширилось, и руководители Guinness были твердо настроены сделать науку фундаментом своего бизнеса. В 1886 году компания весьма успешно вышла на Лондонскую биржу. К тому времени, как Госсет пришел туда работать, Guinness стала крупнейшей пивоварней в мире, а это значило, что ей в огромном количестве требовались хмель и ячмень неизменно высокого качества. Новые пивовары стали собирать нужные данные, но анализировать их было сложно. Несмотря на статус и образование, пивоварам плохо давалась математика, а статистику они не знали вовсе. Поскольку в математике Госсет был лучшим среди худших, именно ему пришлось разбираться в вопросе. Он прочел пару учебников и уже к 1903 году научился на основе стандартного отклонения и размера выборки определять так называемую стандартную ошибку. Он даже предложил самостоятельно разработанный критерий корреляции. В отчете для пивоварни Госсет описал свой новый “урожай” статистических инструментов и пояснил, каким образом они могут улучшить производство. Он также упомянул, что никто на пивоварне – включая ученых пивоваров – прежде ничего из этого не знал из-за “распространенного страха перед математикой”. Видите? Не только вы ее боитесь.
Летом 1905 года компания Guinness отправила своего нового эксперта по статистике в Англию на консультацию к последователю Гальтона Карлу Пирсону, которого в то время считали ведущим мировым статистиком. Госсет объяснил, что хочет научиться сравнивать небольшие количества разных вещей: так, экспериментируя с ячменем, в Guinness рассматривали лишь четыре его сорта. Точно вывести стандартное отклонение для выборки из четырех единиц чрезвычайно сложно, и Госсет надеялся, что Пирсон хотя бы подскажет ему, как в таком случае оценивать ошибку и принимать нужные субъективные решения, например определять, какой уровень вероятности стоит считать значимым. Но в то время еще ни у кого, включая Пирсона, не было статистических инструментов для работы с такими малыми выборками. Постаравшись не обидеть Госсета, Пирсон обучил его всем известным ему статистическим приемам. По словам Госсета, они управились за полчаса.
Как ни странно, этого оказалось достаточно, чтобы по возвращении на Guinness Госсет внедрил кое-какие методы анализа данных. И его инновация была признана успешной, поскольку через год пивоварня снова отправила Госсета работать с Пирсоном и Госсет поступил в Лондонский университетский колледж. К 1907 году, сделав, как он выразился, несколько “удачных предположений”, Госсет получил ответ на свои вопросы об ошибках в малых выборках. Исследовались не данные о ячмене, а рост и длины средних пальцев левой руки преступников из местной тюрьмы, а сведения предоставлял Скотленд-Ярд, что стало возможно, как мы вскоре увидим, поскольку Фрэнсис Гальтон вызвался найти (и искоренить) преступное естество английского общества.
Когда проблема оказалась решена, Госсет снова вернулся в Дублин и применил новые статистические законы. Благодаря им стало очевидно, что лучше всего для Guinness подходит сорт “Лучник”, и пивоварня быстро скупила все семена этого сорта, которые были на рынке: 1000 бочек. Через год после посева у Guinness оказалось 10 тысяч бочек семян, которые можно было распределять между фермерами, а больше их нигде не было. Guinness захватила контроль над самым важным сырьем для своего пива.
Как только вопрос с ячменем был улажен, Госсету разрешили опубликовать свое открытие. Ему не позволили подписать статью своим именем, чтобы конкуренты Guinness не раскрыли секрет пивоварни, и предложили на выбор два псевдонима: Пьюпил (“ученик”) и Стьюдент (“студент”). Так и появился t-критерий Стьюдента.
Этот t-критерий позволяет нам понять, как взаимосвязаны размер выборки и степень неопределенности, которую он вносит в расчеты. Зная это, мы можем оценивать достоверность своих результатов. Инновация Госсета прекрасно работала в Guinness, но правда в том, что никто не обращал на нее внимания, пока Рональд Фишер – человек, который решил, что считается статистически значимым, – не доказал ее математически и не расширил диапазон ее применения. Теперь мы используем t-критерий всякий раз, когда хотим сравнить разные выборки. В медицинских исследованиях мы применяем его, чтобы оценивать действенность антиретровирусной терапии при лечении ВИЧ. В исследованиях бизнеса он позволяет нам изучать, какой эффект оказывают различные вмешательства – например, совершенствование протоколов обслуживания клиентов. И он по-прежнему применяется в той сфере, с которой все и началось, – в сельскохозяйственных исследованиях, где он показывает нам эффективность удобрений, относительную ценность разных сортов выращиваемых культур и безопасность таких переработанных продуктов, как молоко и сыр.
Компромиссы сжатия
Несмотря на все новаторские предложения Фишера, в последние несколько десятилетий миром правит другая выборочная статистика, которая значительно повысила качество нашей жизни и дала нам такие известные аббревиатуры, как JPEG, MPEG,