Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Поэтому мы решили, вооружившись n-грамами, провести напоследок эксперимент и проверить, насколько предсказуемы исторические изменения. Мы протестировали самые простые из возможных прогнозов, которые иногда называют «культурной инерцией». Согласно ей, n-грамы, двигавшиеся вверх, продолжат свое движение вверх, а двигавшиеся вниз будут и дальше двигаться вниз. Фондовый рынок не имеет инерции – в противном случае отличным инвестором смог бы стать каждый. Если же человеческая культура демонстрирует инерцию, то мы сможем многое узнать о будущем n-грама, анализируя его развитие в прошлом.
И вот какой график нарисовала нам машина[219]:
Линией серого цвета мы обозначили среднюю частоту большого количества n-грамов, выбранных нами из-за того, что они демонстрировали последовательное снижение за 20-летний период. Сохраняется ли тенденция по окончании этого периода? Да, причем на протяжении десятилетий. Черным цветом мы выделили другую группу n-грамов, которая стабильно росла за 20-летний период. Ее резкий рост продолжается на протяжении почти столетия – в тех пределах, в которых нам удалось произвести измерения. И результат был тем же самым – прежде росшие n-грамы продолжили срой рост, а снижавшиеся продолжали снижаться. Иными словами, n-грамы, находившиеся в движении, продолжали его (до тех пор, пока на них не начинали действовать психоисторические силы).
Возможно, что наука прогнозирования истории – это не фикция. Нельзя исключать, что наша культура следует детерминистическим законам. И возможно, именно об этом скажут когда-нибудь наши данные.
Но даже если прогнозирование возможно, действительно ли нам это нужно? Конт полагал именно так. Он верил, что при отсутствии объективных измерений, без опровергаемых предсказаний, наше понимание человеческой истории, общества и культуры будет неполным.
Антрополог Франц Боас с этим не соглашался[220]:
Физик сравнивает аналогичные факты, из которых выделяет общее явление. Вследствие этого отдельные факты становятся для него менее важными, поскольку его интересуют общие закономерности.
С другой стороны, факты представляют собой крайне важный и интересный объект для любого историка… Какой из двух методов имеет более высокую ценность? Ответ может быть лишь субъективным…
Скажем о том же коротко: иногда вы хотите посмотреть на график, а иногда – увлечься хорошей книгой.
Добро пожаловать в историю в формате цифрового будущего. Почему бы не попробовать оба способа?
Приложения
Великие битвы истории
ДилеммыДуэлиРелигияНаукаНаукаСоциальные измененияЭкономикаЕще немного экономики049
Окружающая средаМирИнженерные наукиВечный бойБолезниМедицинаЕдаНапиткиИгры и развлеченияНочная жизньЖизнь тяжелаНовые временаВеликие умыМудрые словаО графиках
Графики в этой книге были созданы под впечатлением от великолепного визуального стиля веб-комикса xkcd авторства Рэндалла Манро (http://xkcd.com/). Идея автоматизации создания графиков в стиле xkcd была предложена Дэймоном Макдугаллом. Графики в самой книге создавались в программе Python, с использованием модифицированной версии программы Джейка Вандерпласа. Эти n-грамы можно создавать интерактивно на сайте Google Ngram Viewer: http://books.google.com/ngrams/, а в стиле xkcd – по адресу http://xkcd.culturomics.org. Мы надеемся, что Манро не будет на нас в обиде (см. http://xkcd.com/1007/ и http://xkcd.com/1140/). Некоторые из его любимых n-грамов можно найти по адресу: http://xkcd.com/ngram-charts/.
Обратите внимание, что данные приводятся с учетом регистра, а вид графиков n-грамов зависит от нескольких параметров. Если в заметках не указано иное, то все графики n-грамов, приведенные в тексте книги, в точности соответствуют результатам работы Google Ngram Viewer, при использовании корпуса English 2012 и трехлетнего сглаживания. Также, если не указано иное, текст запроса приводится полностью в нижнем регистре, за исключением имен собственных, которые пишутся как обычно. Все соответствующие массивы данных для работы можно загрузить по адресу: http://goo.gl/3IIA9.
При упоминании конкретных n-грамов, таких как Marc Chagall и Kubismus в корпусе на немецком языке, они указываются в виде NV: «Marc Chagall, Kubismus»/German. В случае если корпус не указан (например, NV: «cubism»), использовался корпус English 2012. В ряде случаев мы указываем диапазон лет или значение параметра сглаживания.
Примечания
1
В самой Конституции Соединенные Штаты упоминаются во множественном числе. К примеру: «Государственной изменой Соединенным Штатам считается только ведение войны против них…» См. U.S. Const., art. III, § 3. (Здесь и далее примечания авторов, если не оговорено иное. – Прим. ред.)
2
Цит. по.: McPherson James M. Battle Cry of Freedom. Oxford: Oxford University Press, 1988. P. 859. (Здесь и далее для удобства читателя в ссылках на литературу имя автора следует за фамилией. Имена приводятся в том виде, в каком они написаны авторами. – Прим. ред.)
3
(adsbygoogle = window.adsbygoogle || []).push({});