Чарльз Уилан - Голая статистика. Самая интересная книга о самой скучной науке
Наконец, самых высоких похвал заслуживают члены моей семьи за ангельское терпение, проявленное во время подготовки книги к публикации. (Листок бумаги со сроками сдачи в печать каждой главы прикреплялся магнитом к холодильнику.) Есть неопровержимые свидетельства того, что я становлюсь в этот период на 31 % раздражительнее и на 23 % истощеннее. Моя жена Лия исполняет роль первого, самого строгого и важного редактора всех моих текстов. Спасибо тебе, Лия, за это, а также за то, что всегда остаешься умным и интересным партнером, поддерживающим меня в любых начинаниях.
Эта книга посвящается моей старшей дочери Кэтрин. Мне с трудом верится, что когда я готовил к публикации книгу Naked Economics, Кэтрин была грудным младенцем, а сейчас уже читает главы моей новой книги и даже делает время от времени ценные замечания. Кэтрин, ты – чудо-ребенок, как, впрочем, и мои младшие, Софи и Си-Джей, которые вскоре тоже будут читать мои книги и давать полезные советы.
Сноски
1
Хоумран – удар в бейсболе, при котором мяч перелетает через все игровое поле; дает право совершить перебежку по всем базам и принести своей команде очко. Прим. перев.
2
Куортербек – распасовщик, играющий помощник тренера в американском футболе. Прим. перев.
3
Тачдаун – в американском футболе: пересечение мячом или игроком с мячом линии зачетного поля соперника. Прим. перев.
4
Коэффициент Джини иногда умножают на 100, чтобы он выражался целым числом. В таком случае для Соединенных Штатов он равнялся бы 45.
5
Netflix – американская компания, поставщик фильмов и сериалов на основе потокового мультимедиа. Прим. перев.
6
Исторически так сложилось, что слово «данные» (data) используется во множественном числе (например, «эти данные являются весьма обнадеживающими»). Это слово можно употреблять и в единственном числе: «данное» (datum); в этом случае речь идет о каком-то отдельно взятом элементе данных (например, ответ одного человека на какой-то один вопрос анкеты, используемой при опросе общественного мнения). Употребление слова «данные» во множественном числе сигнализирует каждому, кто занимается серьезными исследованиями, о том, что вы знаете толк в статистике. С учетом сказанного многие специалисты по грамматике, а также многие издания, такие как The New York Times, в настоящее время согласны с тем, что слово «данные» может означать как единственное, так и множественное число, как свидетельствует приведенная мной цитата из The New York Times.
7
Scholastic Aptitude Test – стандартизированный тест для поступающих в американские высшие учебные заведения. Прим. ред.
8
Разумеется, я заведомо упрощаю здесь многогранные и чрезвычайно сложные проблемы, которые ставит перед нами медицинская этика.
9
В российском прокате этот фильм вышел под названием «Человек, который изменил все». Фильм снят по книге Майкла M. Льюиса, изданной в 2003 году, о бейсбольной команде «Окленд Атлетикс» и ее генеральном менеджере Билли Бине. Его цель – создать конкурентоспособную бейсбольную команду, несмотря на отсутствие больших финансовых возможностей. Главную роль исполняет Брэд Питт. Прим. перев.
10
После того как в баре оказалось бы двенадцать посетителей, медианой была бы средняя точка между доходом посетителя, сидящего на шестом стуле, и доходом посетителя, сидящего на седьмом стуле. Поскольку доход того и другого составляет 35 000 долларов, медиана равняется 35 000 долларов. Если бы доход одного из них равнялся 35 000, а доход другого – 36 000, то медиана для этой группы в целом равнялась бы 35 500 долларов.
11
«Лимонами» на американском сленге называют устройства с дефектами, которые проявляются уже после покупки. Прим. ред.
12
Вот что удалось выяснить в ходе дальнейшего исследования проблемы. Оказалось, что почти все бракованные принтеры производились на заводе в Кентукки, где рабочие разобрали часть сборочного конвейера, чтобы создать подпольное предприятие по изготовлению виски. Постоянно пьяные рабочие и частично разобранный сборочный конвейер стали причиной резкого ухудшения качества выпускаемых заводом принтеров.
13
Интересно отметить, что этот менеджер – один из тех десяти парней с годовым доходом 35 000 долларов, которые сидели в баре, когда туда вошел Билл Гейтс с говорящим попугаем на плече. Причуды судьбы!
14
Марк Твен приписывал эти слова британскому премьер-министру Бенджамину Дизраэли; впрочем, каких-либо документальных свидетельств, подтверждающих авторство Дизраэли, не обнаружено.
15
См. на сайте http://www.bls.gov/data/inflation_calculator.htm.
16
SAT (Scholastic Aptitude Test) – тест на умение грамотно излагать свои мысли в устной форме и тест математических способностей, используемые при поступлении в американские колледжи. Прим. перев.
17
ACT (American College Testing) – стандартизированный тест для поступления в колледжи и университеты США. Прим. перев.
18
Netflix – американская компания, поставщик фильмов и сериалов на основе потокового мультимедиа. Прим. перев.
19
Я имею в виду «человека Шести Сигм». Строчной буквой греческого алфавита σ (сигма) обозначается среднеквадратическое отклонение. «Человек Шести Сигм» – это шесть среднеквадратических отклонений сверх нормы, выраженной в таких понятиях, как статистическая возможность, сила и ум.
20
Для всех этих подсчетов я воспользовался очень удобным биномиальным онлайн-калькулятором с сайта http://stattrek.com/Tables/Binomial.aspx.
21
Агентство НАСА также предупреждало граждан о том, что даже фрагменты упавшего на Землю спутника являются собственностью государства. Таким образом, каждый, кто найдет и спрячет их у себя (например для коллекции), будет считаться нарушителем закона – даже если найдет их в своем дворе.
22
Левитт С., Дабнер С. Фрикономика. – М.: Манн, Иванов и Фербер, 2010.
23
Левитт и Дабнер рассуждали примерно так. Каждый год тонут приблизительно 550 детей в возрасте до десяти лет, а 175 детей в возрасте до десяти лет погибают в результате неосторожного обращения с оружием. Левитт и Дабнер взяли за основу следующие коэффициенты смертности: один утонувший ребенок на каждые 11 000 плавательных бассейнов в сравнении с одним смертельным случаем в результате неосторожного обращения с оружием на каждые «миллион с хвостиком» единиц огнестрельного оружия. Что касается подростков, то указанные коэффициенты могут быть совершенно другими, во-первых, поскольку подростки лучше плавают и, во-вторых, могут гораздо чаще быть виновниками трагедии, если у них в руках случайно окажется огнестрельное оружие. Однако в моем распоряжении нет соответствующих данных.
24
Существует шесть способов выбросить 7 при подбрасывании двух игральных костей: (1,6); (2,5); (3,4); (6,1); (5,2) и (4,3) и лишь два способа выбросить 11: (5,6) и (6,5).
Между тем есть 36 возможных вариантов результата подбрасывания двух игральных костей: (1,1); (1,2); (1,3); (1,4); (1,5); (1,6). И (2,1); (2,2); (2,3); (2,4); (2,5); (2,6). И (3,1); (3,2); (3,3); (3,4); (3,5); (3,6). И (4,1); (4,2); (4,3); (4,4); (4,5); (4,6). И (5,1); (5,2); (5,3); (5,4); (5,5); (5,6). И наконец, (6,1); (6,2); (6,3); (6,4); (6,5) и (6,6).
Следовательно, вероятность выпадания 7 или 11 равняется количеству возможных способов выбросить любое из этих двух чисел, деленное на общее количество возможных вариантов при подбрасывании двух игральных костей, то есть 8/36. Между прочим, значительная часть ранних исследований вероятности выполнялась именно любителями азартных игр в попытках точно определить свои шансы.
25
Полное математическое ожидание для однодолларового билета мгновенной лотереи в штате Иллинойс (округленное до ближайшего цента) подсчитывается следующим образом: 1/15×($2) + 1/42,86×($4) + 1/75×($5) + 1/200×($10) + 1/300×($25) + 1/1589×($50) + 1/8000×($100) + 1/16 000×($200) + 1/48 000×($500) + 1/40 000×($1000) = $0,13 + $0,09 + $0,07 + $0,05 + $0,08 + $0,03 + $0,01 + $0,01 + $0,01 + $0,03 = $0,51. Однако существует также шанс 1/10 получить в качестве выигрыша бесплатный лотерейный билет; ожидаемый доход этого варианта составляет 0,51 доллара; таким образом, ожидаемый доход в целом равняется $0,51 + 0,1×($0,51) = $0,51 + $0,05 = $0,56.
26
Строго говоря, для правильного подсчета математического ожидания необходимо, чтобы сумма вероятностей всех возможных исходов равнялась 1. Здесь же сумма вероятностей представленных исходов составляет 0,2659. Однако, если принять, что с вероятностью 1–0,2659 = 0,7341 выпадает билет без всякого выигрыша (то есть выигрыш равен 0), тогда математическое ожидание подсчитано правильно. Прим. ред.