Вероятности и неприятности. Математика повседневной жизни - Сергей Борисович Самойленко
которую можно использовать для вычисления условных вероятностей.
Применим эти новые определения и соотношения, чтобы разобраться в примере с водителями и тестом на алкогольное опьянение. Мы имеем следующие события: A — водитель пьян, B — тест выдал положительный результат. Вероятности: P(A) = 10 % — для случая, когда остановленный водитель пьян; P(B|A) = 99 % — тест выдаст положительный результат, если известно, что водитель пьян (исключается 1 % ложноотрицательных результатов), P(A|B) = 99 % — тестируемый пьян, если тест дал положительный результат (исключается 1 % ложноположительных результатов). Вычислим вероятность того, что тест даст верный результат, не обвинит невиновного и не пропустит виноватого. Оба эти варианта независимы и вероятность того, что не случится ни та, ни другая ошибка, равна P(B|A)P(A|B) = 98,02 %. Это близко к тому, что ожидалось интуитивно. О чем же мы рассуждали, говоря о несправедливости теста? Мы вычислили P(B) — вероятность получить положительный результат теста на дороге:
Понятие условной вероятности позволяет корректно вести логические рассуждения на языке теории вероятностей. Неудивительно, что теорема Байеса нашла широкое применение в теории принятия решений, системах распознавания образов, спам-фильтрах, программах, проверяющих тексты на плагиат, и многих других информационных технологиях. Подобные примеры тщательно разбираются студентами, изучающими медицинские тесты или юридические практики. Но, боюсь, журналистам и политикам не преподают ни математическую статистику, ни теорию вероятностей. Зато они охотно апеллируют к статистическим данным, вольно интерпретируют их и несут полученное «знание» в массы.
Разберем еще один пример ошибочной интерпретации статистических данных. В июне 2011 года был выпущен публичный отчет о росте уровня занятости в США, он составил 18 тысяч новых работников по всей стране. В газетах штата Висконсин об этом была опубликована статья, в которой отмечалось, что более половины роста (9,8 тысячи человек) приходится именно на этот штат. Статья завершалась хвалебным отзывом о плодотворной работе правительства штата и позже с удовольствием цитировалась политиками и чиновниками. Притом что обе цифры верны и подтасовок в них нет, штат Висконсин никак не может претендовать на доминирующий вклад в общий рост уровня занятости. В том же году в штате Массачусетс появилось 10,4 тысячи новых рабочих мест (58 % от общей цифры), а в Калифорнии — 28,8 тысячи (160 %). Я полагаю, читатель начинает догадываться, что приводимые тут проценты не имеют большого смысла, поскольку в этом же году в ряде штатов, например в Миссури или Вирджинии, произошло сокращение рабочих мест. Таким образом, 18 тысяч — сумма всех положительных и отрицательных изменений.
Где заканчивается свобода в математике?
Здесь стоит ненадолго остановиться. Мы уже достаточно подкованы в математике, чтобы не просто с умным видом поиздеваться над ошибкой журналистов и доверчивостью чиновников, а разобраться в том, что именно произошло. Речь в статье шла о долях, при этом использовались суммы величин, которые могут быть и отрицательными. Что же здесь не так? Ведь долю, то есть рациональное число, можно вычислить от величины любого знака. Здесь нам опять пригодится понятие меры.
Доли, или удельный вклад, имеет смысл вычислять от величины, относящейся к мерам — аддитивной и неотрицательной. Говоря в предыдущей главе о мере как функции над множествами, мы упоминали требование ее неотрицательности, но не заостряли на нем внимание. Само понятие меры появилось как расширение таких категорий, как количество, длина или объем, а эти величины, очевидно, не могут быть отрицательными. Но что случится с нашим определением, если мы разрешим мере быть отрицательной? Может, тем самым мы расширим это понятие и оно станет еще полезнее? Расширили же мы понятие вероятности, введя условную вероятность. Бытует мнение (особенно среди «практиков», инженеров и программистов), что математики изобретают аксиомы и изменяют определения по мере необходимости. Что это вопрос практичности, договоренностей либо даже вкуса. Нет, ребята, математика так не работает.
Приведу два примера, из которых станет ясно, что аксиомы не придумываются. В главе 1, рассматривая петли на наушниках, мы указали, что они образуют группу с операцией сложения, соответствующей нанизыванию их на одну веревку. Для любой группы должны выполняться четыре аксиомы: замкнутость операции группового сложения, ее ассоциативность, наличие единственного нуля (нейтрального элемента), наконец, наличие обратного элемента. А почему мы ничего не говорим о коммутативности сложения (о том, что a + b = b + a)? Легко убедиться в том, что для наших петель, как и для чисел, это свойство выполняется. Кроме того, мы сразу сказали, что ноль — нейтральный элемент, независимо от порядка сложения с ним: (0 + a = a + 0 = a). Раз это должно работать для нуля, почему это не может работать для всех элементов группы?
Дело в том, что коммутативность не вытекает из четырех аксиом группы. Легко найти некоммутативную группу, классическим примером будут движения на плоскости. Если рассмотреть два движения: поворот относительно некой опорной точки и смещение вдоль какого-то вектора, — то результат будет зависеть от порядка этих движений. Убедиться в этом легко, перемещая лист бумаги по поверхности стола. Почему же сложение с нулем должно быть коммутативно? Это требование ассоциативности, а именно выполнения равенства: (a + 0) + b = a + (0 + b). Если бы сложение с нулем зависело от того, справа или слева он находится, то ассоциативность перестала бы работать для всех элементов группы. Эти два свойства не могут идти по отдельности. В то же время добавление свойства коммутативности согласуется с определением группы и расширяет ее до так называемой абелевой группы. Я помню, как был сначала озадачен, а потом восхищен тем, что коммутативность сложения для чисел не вводится искусственно, а может быть выведена из базового определения операции сложения.
Приведу еще один пример, который, возможно, примирит кого-то с диктатурой в математике. Помните школьное правило: «на ноль делить нельзя»? А почему, кто это запретил? Кроме того, теперь мы достаточно грамотны, чтобы уточнить вопрос: что такое «ноль», на который нельзя делить? Тот ли, который оказывается нейтральным элементом при сложении, или речь о каком-то ином объекте? Сразу скажу: да, тот самый, поскольку он, по определению группы, единственный[19]. Более или менее искушенный в математике читатель скажет, что в пределах алгебраической структуры, которая называется полем чисел (рациональных или вещественных, именно их мы проходим в школе), не существует делителей нейтрального элемента по сложению, они просто не содержатся во множестве этих чисел. Можно