Искусство большего. Как математика создала цивилизацию - Майкл Брукс
Нужно провести “проверку гипотезы”. По сути, мы хотим узнать вероятность случайного наступления улучшения. Скажем, начальная средняя оценка боли составила 5,71 (из 10) для 50 испытуемых. Стандартное отклонение в этом наборе данных – 1,97. Группа пациентов, которым дали “БезБол”, сообщает, что боль при электрошоке составила в среднем 4,28 из 10 при стандартном отклонении 1,72. Группа плацебо теперь оценивает боль в 4,80 из 10 при стандартном отклонении 1,42.
Распределения “БезБола”, контрольной группы и группы плацебо
Теперь можно взять данные по группам “БезБола” и плацебо, подставить их в стандартные статистические формулы и вычислить p-значение. Сначала выдвинем гипотезу о результатах приема плацебо и “БезБола”. Наша “нулевая” гипотеза состоит в том, что разница между этими группами объясняется волей случая. Проверим это по формуле из учебника статистики и найдем p-значение, которое покажет, в какой степени мы можем быть уверены в эффективности “БезБола”. Подставив в формулу средние оценки боли, стандартное отклонение и число испытуемых, мы получим так называемый t-критерий. Далее преобразуем его с помощью статистической программы, которая учитывает, какой вопрос мы задаем и сколько у нас испытуемых, в p-значение. В нашем случае t-критерий равен 1,5116. Это дает нам p-значение, близкое к 0,072.
Это немного выше 0,05 – обычного стандарта статистической значимости. Поскольку p-значение показывает, с какой вероятностью мы наблюдали бы столь же значительную разницу в средних оценках боли в том случае, если бы препарат не оказывал никакого действия и работал исключительно как плацебо, это дает основание предположить, что опровергнуть нашу нулевую гипотезу нельзя: похоже, “БезБол” не показывает стабильно более высоких результатов в сравнении с плацебо. В конце концов нам снова приходится принять субъективное решение, но это чрезвычайно полезная инновация. Современные лекарственные препараты основаны на статистике: описанный процесс позволил нам количественно оценивать, насколько хорошо работают лекарства, операции и другие медицинские вмешательства, радикально улучшая – и порой спасая – огромное множество жизней, не расходуя попусту ценные ресурсы системы здравоохранения, например часы работы в операционных и, конечно, деньги.
Виртуозная экстраполяция
Хотя история статистики и вызывает у нас вопросы, а необходимость принимать субъективные решения может показаться нам проблематичной, нет смысла отрицать, что в современном мире статистика обрела огромную важность и влияние. Статистические инструменты каждый день используются в медицине, политике, экономике, правосудии и науке. Но одна область статистики оказывает на нашу жизнь гораздо большее воздействие, чем остальные. Я имею в виду семплирование.
Семплирование – это искусство достоверно экстраполировать знания о малой части чего-либо, чтобы получать представление о целом. Вы постоянно прибегаете к семплированию, но действуете, вероятно, по наитию, без математической точности. Так, готовя спагетти, вы наверняка снимаете больше одной пробы, чтобы удостовериться, что блюдо уже можно подавать к столу. Если вы ищете электрика, то что-то подсказывает вам, что лучше сперва спросить в нескольких местах, сколько стоят необходимые работы, чтобы в итоге с вас не взяли слишком много. В процессе онлайн-шопинга вы также принимаете субъективные решения о семплировании, изучая отзывы покупателей: можно ли считать, что продукт, которому поставили пять высших оценок, лучше, чем продукт, который 200 раз оценили на четверку?
В промышленных масштабах ситуация с семплированием не отличается. Если я сорву с поля 10 спелых колосьев ячменя и изучу их качество, насколько показательными будут результаты моей проверки для оценки состояния всего поля? Если я сниму с заводского конвейера 10 деталей и подвергну их испытанию на прочность, насколько я смогу быть уверенным в качестве остатка партии? Есть ли способ выяснить, будет ли лекарство помогать большинству людей, проверив его лишь на нескольких? Если я могу передать лишь небольшую часть сигнала по электрическому или оптоволоконному кабелю, то есть ли способ собрать отправленные мною фрагменты, чтобы человек на другом конце смог воссоздать оригинальное сообщение? Эти вопросы на множество миллионов долларов лежат в основе нашей потребительской экономики.
История семплирования восходит как минимум к 400 году нашей эры. В санскритском эпосе “Махабхарата” древнеиндийский правитель Ритупарна оценивает количество плодов на двух больших ветвях дерева бибхитаки. Сосчитав плоды на нескольких маленьких веточках, он заявляет, что на всем дереве 2095 плодов и 100 тысяч листьев. Его спутник царь Нала всю ночь не смыкает глаз, чтобы проверить ответ, и приходит к выводу, что он верен. Подобным образом с 1282 года в Англии проверяют монеты, отчеканенные на Королевском монетном дворе. Этот процесс называется пробировкой и предполагает семплирование новых монет для проверки их единообразия.
Англоязычное название – The Trial of the Pyx – происходит от латинского слова, значащего “маленький ящик”. Случайная выборка монет каждого достоинства запирается в нескольких деревянных ящиках. Затем их берут на проверку: их вес, состав, размер и маркировку сравнивают с желаемым стандартом. Число проверяемых монет каждого достоинства определяется пропорционально числу отчеканенных монет: предполагается, что если их характеристики соответствуют установленным нормам, то практически наверняка им будут соответствовать характеристики всей партии.
Пробировка монет проходит каждый год в зале Почтенного общества золотых дел мастеров в Лондоне. Церемония поражает размахом и красками, но строго следует древним протоколам. Присутствовать на ней обязаны канцлер казначейства – или назначенный им представитель, – а также полноправные члены Почтенного общества золотых дел мастеров и сотрудники монетного двора. Решение о том, хорошо ли двор отчеканил новые монеты, выносит жюри из членов Общества золотых дел мастеров. Если все в порядке, то находящиеся в обращении монеты, не соответствующие стандартам, можно вполне обоснованно считать поддельными.
Королевский монетный двор всегда гордился своими денежными знаками и безжалостно преследовал фальшивомонетчиков. В 1696 году смотрителем монетного двора стал особенно ревностный человек, а эта должность, помимо прочего, предполагает борьбу с подделкой денег. Исаак Ньютон никогда прежде не состоял на государственной службе, но призвал на помощь свои наблюдательность, проницательность и дальновидность. К 1699 году он лично выследил и арестовал Уильяма Челонера – крайне злостного фальшивомонетчика. Челонер был настолько искусен и настолько хладнокровен, что даже предложил свою помощь властям, поскольку “только вор может поймать вора” и положить конец бичу фальшивомонетничества. Но с Ньютоном ему было не тягаться, и 16 марта его повесили[195]. Вскоре после этого Ньютон занял еще более высокую должность: стал управляющим монетного двора. Именно тогда у него и