Стивен Строгац - Удовольствие от Х.Увлекательная экскурсия в мир математики от одного из лучших преподавателей в мир
Предположим, что эта доля убийств одинакова для всех женщин независимо от того, избивали их при жизни или нет. Тогда делим 100 тысяч избиваемых женщин из нашей гипотетической выборки на 35 673 и в результате получаем 2,8 женщин, то есть столько убито лицами, которые не являлись их партнерами. Округлив 2,8 до 3, получаем оценку, приведенную в данной работе.
24. Распутывание всемирной паутины
101. Введение в поиск в интернете и анализ ссылок см. D. Easley and J. Kleinberg, Networks, Crowds, and Markets (Cambridge University Press, 2010). Популярное изложение истории поиска в сети, рассказ о его основных действующих лицах и компаниях ищите в J. Battelle, The Search (Portfolio Hardcover, 2005). Тем, кто хорошо знаком с линейной алгеброй, будет интересна история развития анализа ссылок в статье S. Robinson, The ongoing search for efficient Web search algorithms, SIAM News, Vol. 37, № 9 (2004).
102. Если вас смутило использованное мной слово «кузнечик», поясню, что этим ласковым именем называют ученика, которому еще предстоит многому научиться у мастера дзен. В телесериале «Кунг-фу» слепой монах По учит мудрости своего ученика Кэйна и на первом уроке называет его кузнечиком.
Мастер По. Закрой глаза. Что ты слышишь?
Юный Кэйн. Я слышу воду. Я слышу пение птиц.
По. Слышишь ли ты, как бьется твое сердце?
Кэйн. Нет.
Мастер По. Слышишь ли ты кузнечика, что стрекочет у твоих ног?
Кэйн. Старик, как тебе удается слышать все это?
По. Юноша, как ты умудряешься этого не слышать?
103. Признание существования проблемы замкнутого круга для ранжирования веб-страниц, а также ее решение с помощью линейной алгебры вылилось в два направления исследований, опубликованных в 1998 году. Одно было проведено моим коллегой по Корнуолльскому университету Джоном Клейнбергом, который впоследствии стал экспертом исследовательского центра IBM Almaden Research Center. Его исследование посвящено алгоритму HITS (альтернативной форме анализа ссылок, появившейся немного раньше, чем алгоритм PageRank от Google), см. J. Kleinberg, Authoritative sources in a hyperlinked environment, Proceedings of the Ninth Annual ACM-SIAM Symposium on Discrete Algorithms (1998).
Вторая линия исследований проводилась основателями Google Ларри Пейджем и Сергеем Брином. В основе их алгоритма PageRank лежало количество времени, которое случайный пользователь сети будет проводить на каждой странице. Этот процесс описывается по-иному, но приводит все к той же проблеме замкнутого круга. Обоснования метода PageRank даны в статье S. Brin and L. Page, The anatomy of a large-scale hypertextual Web search engine, Proceedings of the Seventh International World Wide Web Conference (1998), рр. 107–117.
Как это часто случается в науке, поразительно похожие предвестники этих идей уже были открыты в других ее областях. С предысторией появления PageRank в библиометрике, психологии и социологии можно ознакомиться в статье М. Franceschet, PageRank: Standing on the shoulders of giants, Communications of the ACM, Vol. 54, № 6 (2011), доступной на http://arxiv.org/abs/1002.2858, а также S. Vigna, Spectral ranking, на http://arxiv.org/abs/0912.0238.
104. Введение в линейную алгебру и способы ее применения в различных областях науки прекрасно изложены в книге G. Strang, Introduction to Linear Algebra, 4th edition (Wellesley-Cambridge Press, 2009).
105. Некоторые наиболее впечатляющие области применения линейной алгебры описаны в работе D. James, М. Lachance, and J. Remski, Singular vectors’ subtle secrets, College Mathematics Journal, Vol. 42, № 2 (March 2011), рр. 86–95.
106. Согласно Google, термин PageRank происходит от имени Ларри Пейджа, а не от английского слова webpage (веб-страница). См. http://web.archive.org/web/20090424093934/http://www.google.com/press/funfacts.html.
107. Эта идея основана на том, что лицо человека представляет собой комбинацию небольшого числа его основных компонентов. Впервые линейная алгебра была применена для распознавания лиц в работе L. Sirovich and М. Kirby, Low-dimensional procedure for the characterization of human faces, Journal of the Optical Society of America A, Vol. 4 (1987), рр. 519–524 и получила дальнейшую разработку в исследовании М. Turk and A. Pentland, Eigenfaces for recognition, Journal of Cognitive Neuroscience, Vol. 3 (1991), рр. 71–86, доступном на http://cse.seu.edu.cn/people/xgeng/files/under/turk91eigenfaceForRecognition.pdf.
Полный список работ, посвященных этой проблеме, см. на главной странице сайта Face Recognition (http://www.face-rec.org/interesting-papers/).
108. См. L. Sirovich, A pattern analysis of the second Rehnquist U.S. Supreme Court, Proceedings of the National Academy of Sciences, Vol. 100, № 13 (2003), рр. 7432–7437. Этому исследованию посвящена статья N. Wade, A mathematician crunches the Supreme Court’s numbers, New York Times (June 24, 2003). Следующая работа предназначена для специалистов в области права и написана математиком и профессором права: P. H. Edelman, The dimension of the Supreme Court, Constitutional Commentary, Vol. 20, № 3 (2003), рр. 557–570.
109. Историю приза компании Netflix, а также интересные подробности о первых претендентах на него читайте в статье C. Thompson, If you liked this, you’re sure to love that — Winning the Netflix prize, New York Times Magazine (November 23, 2008). Победитель был определен в сентябре 2009 года, через три года после начала соревнования, см. S. Lohr, A $1 million research bargain for Netflix, and maybe a model for others, New York Times (September 22, 2009). Применение метода разложения матрицы по собственным значениям для определения приза Netflix описано в работе B. Cipra, Blockbuster algorithm, SIAM News, Vol. 42, № 4 (2009).
110. Для простоты я представлю только базовую версию алгоритма PageRank. Для обработки сетей с некоторыми другими структурными свойствами его необходимо изменить. Предположим, в сети есть страницы, которые ссылаются на другие, но те, в свою очередь, на них не ссылаются. В процессе обновления эти страницы потеряют свой PageRank. Они отдают его другим, и он больше не восполняется. Таким образом, в конце концов они получат значения PageRank, равные нулю, и с этой точки зрения становятся неразличимыми.
С другой стороны, существуют сети, где некоторые страницы или группы страниц открыты для накапливания PageRank, но при этом не делают ссылок на другие страницы. Подобные страницы действуют как накопители PageRank.
Чтобы избежать подобных результатов, Брин и Пейдж изменили свой алгоритм следующим образом. После каждого этапа в процессе обновления данных все текущие значения PageRank уменьшаются на постоянный коэффициент, так что их сумма будет меньше 1. Затем остатки PageRank равномерно распределяются между всеми узлами в сети, как будто «сыплются с неба». Таким образом, алгоритм завершается действием уравнивания, распределяющим значения PageRank между самыми «бедными» узлами.
Более тщательно математика PageRank и интерактивные исследования рассматриваются в работе E. Aghapour, T. P. Chartier, A. N. Langville, and K. E. Pedings, Google PageRank: The mathematics of Google (http://www.whydomath.org/node/google/index.html). Полную информацию, изложенную в доступной форме, вы найдете в книге A. N. Langville and С. D. Meyer, Google’s PageRank and Beyond (Princeton University Press, 2006).
25. Самые одинокие числа
111. Гарри Нилссон написал песню One, получившую известность под названием Three Dog Night. Она стала хитом, заняв пятое место в горячей сотне хитов Billboard Hot 100, а Эйми Манн создала ее великолепную версию для фильма «Магнолия».
112. См. P. Giordano, The Solitude of Prime Numbers (Pamela Dorman Books/Viking Penguin, 2010).
113. Сложно сказать, с чего начать, чтобы поближе познакомиться с теорией чисел, и особенно с загадками простых чисел. Вы можете выбрать одну из следующих трех замечательных книг. Все они выпущены примерно в одно и то же время и все обращаются к гипотезе Римана, которая рассматривается как самая большая нерешенная задача в математике. Чтобы глубже познакомиться с математическими подробностями и историей гипотезы Римана, я рекомендую книгу J. Derbyshire, Prime Obsession (Joseph Henry Press, 2003). В книгах D. Rockmore, Stalking the Riemann Hypothesis (Pantheon, 2005) и M. du Sautoy, The Music of the Primes (Harper Collins, 2003) больше внимания уделяется последующему развитию этой темы, однако они тоже написаны в очень доступной форме.
Прим. ред.: По теории чисел существует такая обширная литература, что трудно остановиться на чем-то одном. Вот несколько «классических» введений в эту теорию: Боревич З. И., Шафаревич И. Р.. Теория чисел. М. : Наука, 1972; Виноградов И. М. Основы теории чисел. М.-Л.: Гостехиздат, 1952; Хинчин А. Я. Три жемчужины теории чисел. М. : Наука, 1979. Литература по простым числам: Гальперин Г. «Просто о простых числах» // Квант. 1987. № 4; Генри С. Уоррен. Формулы для простых чисел // Алгоритмические трюки для программистов. М. : «Вильямс», 2007; Матиясевич Ю. Формулы для простых чисел // Квант. 1975. № 5; Карпушина Н. Палиндромы и «перевертыши» среди простых чисел // Наука и жизнь. 2010. № 5. О гипотезе Римана и ее связи с простыми числами см. интересную статью Николенко С. Проблемы 2000 года: гипотеза Римана // Компьютерра. 2005. Рекомендуем также интересный и познавательный сайт «Числонавтика», посвященный теории чисел (и не только) по адресу http://www.numbernautics.ru/.
Дж. Дербишир. Простая одержимость. Бернхард Риман и величайшая нерешенная проблема в математике. М. : Астрель, 2010.
114. Использование теории чисел в криптографии описано в работе M. Gardner, Penrose Tiles to Trapdoor Ciphers (Mathematical Association of America, 1997), главы 13 и 14. В первой из этих глав приводится знаменитая статья Гарднера, опубликованная в августе 1977 года в журнале Scientific American, где он рассказывает о создании криптографической системы RSA, взломать которую практически невозможно. В главе 2 описывается «ужас», который вызвало это открытие в Национальном агентстве безопасности. О последних исследованиях в этой области говорится в главе 10 книги du Sautoy, The Music of the Primes.