Kniga-Online.club
» » » » Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Читать бесплатно Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры. Жанр: Научная Фантастика издательство АСТ, год 2004. Так же читаем полные версии (весь текст) онлайн без регистрации и SMS на сайте kniga-online.club или прочесть краткое содержание, предисловие (аннотацию), описание и ознакомиться с отзывами (комментариями) о произведении.
Перейти на страницу:

И, наконец, мы смогли ответить на «детский» вопрос, с которого начали свое путешествие: «Почему мы говорим drove, а не drived

Причина, по которой мы все еще говорим drove – отказавшись при этом от других неправильных форм типа throve, – состоит в том, что drove используется в сотни раз чаще, чем throve. Это значит – основываясь на нашем небольшом уравнении, – что для drove вероятность стать правильным в десять раз меньше, чем для throve. Разумеется, со временем drove исчезнет, если английский язык проживет достаточно долго[68]. Наши расчеты показывают, что у нас есть примерно 7800 лет, перед тем как глагол drove скроется в лучах заката. Так что дети еще какое-то – довольно долгое – время будут задавать свой детский вопрос.

Блестящая туфля Джона Гарварда

В центре Гарвард-Ярда находится большая статуя, поставленная в честь Джона Гарварда. Эта бронзовая фигура имеет довольно скучный цвет, если не считать сияющей левой туфли. По какой-то странной причине фотография с рукой, касающейся туфли, считается чуть ли не обязательной для любого туриста, посещающего Гарвард.

Почему туфля у статуи Джона Гарварда так сверкает? Большинство считает, что, когда скульптура создавалась, вся она – включая обувь – имела скучный бронзовый цвет и что постепенная полировка тысячами рук туристов позволила проявиться блестящей поверхности.

Однако бронза – это изначально сверкающий металл. Когда скульптура была отлита более 100 лет назад, то она – как и любая другая бронзовая скульптура – сверкала довольно ярко. Верхний матовый слой скульптуры, известный под названием «патина», представляет собой результат коррозии, связанной с природными условиями, усилиями реставраторов и даже желанием самого автора. Подлинный цвет металла выжил лишь в туфле, благодаря частой полировке руками проходящих мимо[69].

И это очень похоже на неправильные глаголы. При первой встрече с ними вы не можете не удивиться: почему эти странные исключения дожили до наших дней? Однако, по сути, неправильные глаголы следуют в наши дни тем же закономерностям, что и много столетий назад. Хотя язык вокруг них менялся, частый контакт защищал неправильные глаголы от коррозии. Они представляют собой окаменелости эволюционного процесса, который мы только начинаем понимать. В наши дни мы называем все остальные глаголы правильными или регулярными. Однако регулярность – это не свойство языка по умолчанию. Правило – это могильный камень для тысячи исключений.

Словарь и конкорданс

Книга Word Index to James Joyce’s Ulysses была подлинным триумфом, отражавшим годы настойчивости и внимания к деталям. Во время публикации в 1937 году подобные индексы были доступны лишь для самых важных книг, несмотря на тот факт, что само по себе написание конкордансов имеет долгую и славную историю. Старейшие конкордансы еврейской Библии, известные под названием Масора, возникли более тысячи лет назад.

Все изменилось в 1946 году. В тот год иезуитскому монаху по имени отец Роберто Буса пришла в голову отличная идея. Буса, изучавший творчество плодотворного теолога Фомы Аквинского, захотел создать конкорданс работ Аквината, который бы помогал ему в исследованиях. Компьютерная технология только начинала свое резкое восхождение, и Буса посчитал, что сможет создать конкорданс новым способом, «скормив» текст книги в одну из новых машин. Он отправился с этой идеей прямиком в IBM. Представители компании выслушали его и решили поддержать. Потребовались 30 лет и серьезная помощь со стороны IBM, однако со временем план Бусы сработал – в 1980 году был завершен монументальный Index Thomisticus[70]. Мир исследователей был впечатлен. Как и Index Хенли, Index Бусы позволил развиться новой области деятельности. Работа в этой области (известной в наши дни под названием цифровых гуманитарных наук) направлена на выявление того, каким образом компьютеры могут пригодиться для таких традиционных гуманитарных занятий, как история и литература[71].

Несмотря на всю важность этих индексов, их можно считать своего рода лебединой песнью. Колоссальная мощность современных компьютеров позволяет использовать для создания конкордансов одну-единственную строчку простого программного кода, который обеспечивает получение нужного результата за считаные секунды. К тому времени как Реймер опубликовала свой алфавитный эксперимент под названием Legendary, Lexical, Loquacious Love – представляющий собой, по сути, конкорданс, но без отсылок на номера страниц, – сам по себе процесс создания конкордансов перестал считаться серьезным занятием, заслуживающим признания. В наши дни ученые редко заботятся о том, чтобы создавать новые конкордансы. В этом нет нужды, поскольку даже дешевый ноутбук почти мгновенно найдет все случаи употребления определенного слова даже в длинном тексте. На первый взгляд, эпоха конкордансов ушла в прошлое.

Однако если вы поднимете крышку современных технологий, вас удивит увиденное внутри. Сегодняшний мир не может прожить без поисковых машин в Интернете, самых мощных инструментов поиска информации из когда-либо созданных. Что такое поисковая машина? По сути, она представляет собой список слов и страниц в сети Интернет, где эти слова появляются. За каждым крошечным белым поисковым окошком кроется огромный цифровой конкорданс.

Конкордансы не умерли со времен Бусы. Напротив, они завоевали этот мир.

Разделить розу на части и посчитать лепестки

Ципф был удивительным человеком, чья работа изменила множество областей знаний, некоторые из которых даже не входили в сферу его научных интересов. В наши дни сложно заниматься множеством вещей – от лингвистики до биологии, от городского планирования до физики процесса сыроварения, не сталкиваясь с наследием Ципфа. В своей работе Ципф подарил нам множество подсказок, необходимых для открытия секретов эволюции языка.

Но что же в этом довольно странном теоретике германской литературы превратило его, выражаясь научным языком, в пророка?

Джордж A. Миллер, один из основателей когнитивной психологии, как-то раз сказал о Ципфе интересную фразу, и нам кажется, что она позволяет в каком-то смысле ответить на этот вопрос. По мнению Миллера, Ципф был представителем «такого типа людей, которые разделяют розы на части, чтобы посчитать их лепестки» [72]. На первый взгляд это кажется не особенно лестным. Неужели Ципф так навязчиво занимался подсчетами, что не мог оценить красоту цветка?

(adsbygoogle = window.adsbygoogle || []).push({});
Перейти на страницу:

Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки kniga-online.club.


Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы

Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.


Уважаемые читатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

  • 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
  • 2. Просьба отказаться от оскорблений, угроз и запугиваний.
  • 3. Просьба отказаться от нецензурной лексики.
  • 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор kniga-online.


Прокомментировать
Подтвердите что вы не робот:*
Подтвердите что вы не робот:*