Джейсон Меркоски - Книга 2.0. Прошлое, настоящее и будущее электронных книг глазами создателя Kindle
Однако сейчас мы живем в цифровом мире. С 2009 года в мире больше книг издается самими авторами, чем обычными издательствами. Только в 2011 году на рынок вышло 150 тысяч наименований самиздата, если верить данным Bowker – книготорговой организации США. Это гораздо больше книг, чем люди могут успеть перевести. Быть может, вообще не стоит полагаться на переводчиков? Возможно, сейчас мы имеем достаточно опыта, чтобы автоматизировать процесс перевода.
Например, Google уже предлагает возможность перевести любую электронную книгу на любой язык. Я решил выяснить, насколько точным будет автоматический перевод, и в качестве эксперимента взял абзац из этой книги, перевел с помощью переводчика Google на другой язык (в данном случае китайский), а затем перевел его обратно на английский. Например, фраза «Языки – это коробки с пазлами» при переводе на китайский и обратно стала выглядеть так: «Языки – это тайные ящики, старые ящики с головоломками». Чтобы определить процент успешности перевода, я вычел количество правильно переведенных слов из общего их количества и разделил на два, потому что процесс перевода проходил дважды.
Таким образом я проверил несколько языков. Результаты разнятся от 83 % в случае с немецким и до 65 % в случае с японским языком, в среднем точность перевода составляет примерно 75 %. Циник сказал бы, что это доказывает только то, что моя писанина больше напоминает немецкий язык, чем японский. Но я интерпретирую эти результаты таким образом, что в среднем три четверти содержания любой книги, сопоставимого с моей по уровню сложности, можно довольно неплохо автоматически перевести на любой другой язык.
Как сейчас обстоит дело с автоматическим переводом? Виртуальный помощник Siri от Apple вроде бы доводит показатель успешности до 86 %, но клиенты все равно жалуются. Очевидно, придется подождать еще несколько лет, пока станет возможным полностью автоматический перевод электронных книг и мы добьемся такого уровня распространения, который я нафантазировал выше. Сейчас автоматический перевод еще не очень хорош, хотя его предоставляет Google – компания, известная своим опытом работы с электронными книгами. Но вскоре – возможно, вообще в мгновение ока – автоматические переводы вполне можно будет читать, хотя, думаю, они никогда не сравнятся по качеству с переводами опытных специалистов.
Возможно, самое лучшее, что можно сказать о будущем, – это то, что оно непредсказуемо. Не исключено, что какие-нибудь революционеры электронных книг – например, Google – построят новую Вавилонскую башню, только наоборот, реконструируя ее из обломков, разбросанных по всем культурам. Удивительно, но новая Вавилонская башня может вырасти из ничем не примечательного ангара без окон, в котором находится электронное облако Google. Компания вполне может справиться с этой задачей благодаря своему опыту и программам перевода.
Действительно ли нужно иметь богатое воображение, чтобы представить, как Google вскоре воссоздаст Вавилонскую башню из руин, по капче[87] за раз? (Капча – это форма, которую вы заполняете на сайте, чтобы доказать, что вы не робот. Обычно вам предлагают впечатать расплывчатое слово.) Большинство капчей в интернете взято из Google. Таким способом Google исправляет ошибки конвертирования в своих электронных книгах. Каждый раз, когда вы подтверждаете свою личность на сайте, вы помогаете Google расшифровать одно-два слова в миллионах их электронных книг.
Как технический специалист я полон оптимизма и считаю, что вскоре мы сможем неплохо переводить почти все электронные книги. И это прекрасно, ведь появится огромное количество новых авторов! Эти авторы не обладают коммерческой привлекательностью, чтобы издательства решили заказать их перевод, но я все равно хотел бы прочитать их произведения.
Закладка: словари
Словари в том виде, какими мы их знаем, представляют собой статические срезы культуры в определенный момент, и этот момент определяет группа пожилых людей, которые сидят в башне из слоновой кости в графстве Оксфордшир в Англии. Однако эта башня из слоновой кости постепенно крошится, и на ее место приходят такие сайты, как Wordnik и UrbanDictionary.
Судя по моему опыту, CEO компаний – это обычно хитрые реалистичные дельцы, у которых в голове только цифры. А вот основатели компаний часто интересные люди, вкладывающие в дело свою душу. Такова и Эрин, основательница Wordnik[88]. Она такая милая, что, наверное, никогда ни о ком не подумала плохо. У нее даже на визитной карточке сердечко!
Эрин раньше редактировала оксфордские словари, а потом основала компанию по созданию контекстных словарей, которые ищут слова в интернете, книгах и журналах и определяют их контекстуальное значение, используя подсказки в содержании.
В современных ридерах и самых продвинутых электронных книгах часто есть словари, чтобы можно было проверить незнакомые слова, и это очень здорово. Мне не хватает такой возможности, когда я читаю бумажные книги. В такие моменты мне часто хочется задать поиск по бумажной странице, выбрать слово и посмотреть его значение.
Словарь, встроенный в электронный ридер, – это отличная идея. Со временем словари станут более увлекательными, и это правильно. Слышите меня? Читать словари станет увлекательно! Вы сможете лучше понять культурный контекст, используя новые интернет-словари и энциклопедии, прикрепленные к соответствующей книге.
Например, вы читаете рассказ о Шерлоке Холмсе, написанный в 1890-е годы. Как здорово было бы иметь словарь культуры той эпохи – словарь викторианской культуры, содержащий сленг и названия торговых марок того времени! С его помощью можно было бы отыскать в книге скрытые до сих пор смыслы.
Иногда издатели встраивают словарики в некоторые электронные книги. Эти интерактивные словарики легко вписываются в текст и при нажатии на незнакомое слово или фразу выдают их определения. Поскольку цифруется все больше книг, то появятся алгоритмы поиска в тексте сленга и названий торговых марок или других культурно значимых отсылок. Соответствующие программы будут автоматически собирать их на ненавязчивых словарных ресурсах, и ими можно будет пользоваться при чтении.
В этой картине мира словари больше не являются творением бородатых стариков вроде Ноя Вебстера[89], который десятилетиями собирал каталожные карточки и организовывал их в соответствии со своими представлениями о словаре. Сейчас сама культура создает собственный словарь. И чем больше материала, тем лучше и обширнее словарь.
Я приветствую то, что делают такие люди, как Эрин. Пройдет несколько лет, и онлайн-словари придут на смену словарям, встроенным в ридеры. Я могу представить себе и такое время, когда подобного рода словари, притаившиеся в уголке мерцающего экрана iPad, помогут вам понять авторский замысел.
Будете ли вы пользоваться такими словарями? Или же вы считаете, что вам словари уже ни к чему и лучше наслаждаться полетом авторской фантазии, не отвлекаясь на поиск нужного слова? Или же вы вообще думаете, что словари отжили свое и в языке достаточно базовых слов, чтобы ясно выражать мысли?
В одном комиксе на сайте xkcd.com был нарисован план ракеты «Сатурн-5»[90], а ее компоненты описывались с помощью тысячи самых популярных слов английского языка. Как ни странно, описание было вполне понятным. Самого слова «ракета» среди них нет, но на чертеже было написано: «Здесь выходит огонь». Капсула для экипажа была обозначена как «комната с людьми». Это просто блестящая идея. Наберите в поисковике «Saturn 5 top 1000» и оцените задумку во всем ее блеске. А заодно и расскажите мне, что вы думаете о будущем словарей и слов!
http://jasonmerkoski.com/eb/15.html
Изменения языка:
«Когда апрель обильными дождями…»[91]
Lingo S changiN fst 2day, tnk u cn kip ^ W it? gr8. NP.
f nt, ur n 4 a vvv hrd time:([92]
Наш язык меняется, и лексикографы выпрыгивают из окон своих башен из слоновой кости.
Английским языком больше не управляют редакторы, сидящие в издательствах словарей Merriam-Webster или Oxford English Dictionary. Поверьте мне, уж я-то знаю. Я встречался с этими редакторами в их офисах – там не осталось и духа английского языка. Он бродит по миру и вряд ли вернется обратно.
Порой новые слова входили в язык десятилетиями, но сейчас они укрепляются в нем со скоростью СМС. У нас есть даже слова, которые в строгом смысле словами не являются. Например, n00b или w00t[93] – примеры так называемого leetspeak – интернет-жаргона, который вошел уже и в общее употребление. По оценке ситуации за 2012 год, ежегодно в английский язык входит более 8500 новых слов. Большинство из них – это названия технической продукции, например Twitter или iPad.
Как будет выглядеть язык в будущем? Превратится ли он в некий странный гибрид букв и цифр? Будут ли в новых словах другие символы, использующиеся в компьютерном наборе? Попадут ли в серьезные романы смайлики? Будет ли великий американский роман написан на смартфоне, по одному текстовому сообщению за раз, так чтобы все смогли читать его вживую в интернете?