Kniga-Online.club
» » » » Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Читать бесплатно Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры. Жанр: Научная Фантастика издательство АСТ, год 2004. Так же читаем полные версии (весь текст) онлайн без регистрации и SMS на сайте kniga-online.club или прочесть краткое содержание, предисловие (аннотацию), описание и ознакомиться с отзывами (комментариями) о произведении.
Перейти на страницу:

К счастью, все больше новых книг появляется в цифровой форме и распространяется в электронном виде сразу же с момента публикации. Поскольку сейчас издается больше книг, чем когда-либо прежде в человеческой истории, доля книг, существующих в цифровой форме, значительно увеличивается с каждым днем.

Тем не менее у нас все равно остается проблема старых книг, существующих, к нашему неудобству, лишь в виде физических объектов. Именно здесь должны быть сконцентрированы основные усилия в области оцифровки. Частные корпорации и правительства занимаются этим вопросом, желая как сохранить наше коллективное наследие, так и заработать на нем. Во главе процесса остается Google. Компания уже оцифровала свыше 30 из 130 миллионов книг, существующих в наши дни. По ее расчетам, работа будет завершена к 2020 году. Иными словами, есть основания полагать, что вскоре подавляющее большинство имеющихся книг будет доступно в цифровом формате.

С количественной точки зрения это 25-кратное увеличение базы – с 4 до 100% – окажет огромное влияние на качество наблюдений, доступных для нашего культурного телескопа. Как не вспомнить о Галилее, вытолкнувшем Землю с центрального места во Вселенной с помощью телескопа, который был всего в тридцать раз более зорким, чем невооруженный глаз.

Несмотря на это, у нашего процесса изучения книг имеется целый ряд серьезных трудностей.

Первая из них связана с законодательством об авторском праве – более агрессивным, чем во времена По, и настолько же устаревшим. Хорошим примером может служить закон о продлении срока копирайта 1998 года. Согласно этому акту, авторские права на произведения сохраняются в течение 70 лет после смерти автора. По сути, это препятствует онлайновому изучению почти всех книг, опубликованных после 1923 года, причем в законе не делалось исключений для цифровых исследований или цифровых библиотек. Организации наподобие Internet Archive, HathiTrust и проекта «Гутенберг» прилагают массу усилий, чтобы сделать книги максимально доступными[198]. Однако состояние законодательства в области авторского права таково, что они практически бессильны, когда речь заходит о книгах, опубликованных в прошлом столетии.

Это оказывает влияние на остальные элементы нашей информационной экосистемы. Например, наша исследовательская группа под названием «Культурная обсерватория» создала открытые инструменты, более мощные, чем Ngram Viewer, и способные разделять и анализировать данные книг множеством разных способов. Мы способны моментально изучить, как использовалось слово «ворон» на территории Соединенных Штатов в поэтических произведениях авторов в возрасте чуть за тридцать. Но мы можем сделать это только по данным до 1923 года. Когда дело касается прошлого столетия, то любой юрист, стоящий на страже корпоративных интересов, воскликнет (на манер ворона – героя стихотворения По): «Никогда!»

Есть и еще одна, значительно более серьезная опасность, с которой сталкиваются книги. По мере того как цифровые книги и цифровая информация получают все большее распространение, выживание физических книг оказывается под угрозой сразу на нескольких фронтах. Уже через три года после появления на рынке платформы Kindle для чтения электронных книг продажи книг в формате Kindle на сайте Amazon превысили по объему продажи бумажных[199]. И это происходит не только в Amazon – в последние годы произошел вполне заметный сдвиг в сторону электронных книг на любых платформах и от любых продавцов. Разумеется, в долгосрочной перспективе печатный вид сохранят тексты огромной важности и значения, вроде Библии. Однако таких текстов немного. Длинный хвост ципфовского распределения показывает, что печать книг пойдет по пути развития неправильных глаголов. Через несколько лет книги наподобие нашей не будут иметь печатного вида.

Книги в своем физическом виде находятся под угрозой даже в своей привычной цитадели – библиотеке[200]. На протяжении тысячелетий библиотека была единственным учреждением, призванным сохранять исторические записи. Однако в отличие от активно развивающихся онлайн-библиотек, их традиционные физические сородичи сталкиваются с большими проблемами. Через несколько лет у 60% библиотек бюджет снизится или вообще исчезнет. При отсутствии достаточного объема площадей и финансов библиотекам придется избавляться от целого ряда старых книг, чтобы выделить место для новых. Проблема состоит в том, что библиотеки не могут просто раздать свои старые книги. В библиотечные книги встроены специальные устройства, препятствующие воровству. И это приведет к тому, что честные люди будут время от времени считать, что эти книги были когда-то похищены из библиотек, и приносить их обратно. Удалять эти отслеживающие устройства довольно дорого. Поэтому библиотеки часто предпочитают сделать то, что кажется нам немыслимым, – они тайно уничтожают книги. Это происходит в огромных масштабах. Крупные библиотеки иногда разом избавляются от сотен тысяч книг.

Какие же книги покидают библиотеки? Практика варьируется, однако в целом библиотеки не особенно церемонятся с книгами. Мало кто прилагает усилия для отслеживания того, что мы теряем. В одном недавнем случае были уничтожены книги из библиотеки бывшего британского премьер-министра Дэвида Ллойд-Джорджа. Время от времени библиотека будет решать, от каких книг избавиться, проверяя, какие из них уже оцифровала Google. В результате мы внезапно можем лишиться значительной доли своего культурного наследия. Несколько глав назад мы рассказали о том, как цензура способна задавить те или иные идеи. Здесь же происходит обратное – попытки сделать книги более доступными угрожают их физическому выживанию. Оцифровка книг приводит к весьма противоречивым результатам.

Газеты. Разумеется, исторические записи не ограничиваются одними лишь книгами. К примеру, «кругосветный розыгрыш» По появился в газете. Старые газеты представляют собой уникальный ресурс, в котором отражены повседневные проблемы городов, общественных движений и других социальных групп. Насколько велики шансы найти цифровое издание «кругосветного розыгрыша» По?

Поначалу мы считали, что шансы на это велики. Оцифровка старых газет приобрела значительные масштабы. К настоящему времени ведущие газеты вроде New York Times, Boston Globe и многих других уже полностью оцифровали свои архивы. Национальный фонд гуманитарных наук профинансировал оцифровку старых американских газет – около шести миллионов страниц, отражавших историю целого столетия. Прогрессировали и другие страны. В рамках одного лишь проекта Australia’s Trove было оцифровано около ста миллионов газетных статей. Этой деятельностью в течение какого-то периода занималась и Google, оцифровав архивы двух тысяч газет[201].

(adsbygoogle = window.adsbygoogle || []).push({});
Перейти на страницу:

Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки kniga-online.club.


Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы

Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.


Уважаемые читатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

  • 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
  • 2. Просьба отказаться от оскорблений, угроз и запугиваний.
  • 3. Просьба отказаться от нецензурной лексики.
  • 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор kniga-online.


Прокомментировать
Подтвердите что вы не робот:*
Подтвердите что вы не робот:*