Компьютерра - Журнал "Компьютерра" №707
Говорят, что рассуждать о каком-то не то чтобы доходе - хотя бы об окупаемости книги до ее третьего тиража, - просто смешно. А будет ли этот третий (даже и второй) тираж у красного двухтомника - тоже неизвестно. Так что проект этот, по моему пониманию, не просто невыгодный, а возможно, и демонстративно антикоммерческий. Ну то есть - сам по себе. Зато крайне художественный и концептуальный, - что, очень возможно, обернется даже и прибылью - только не прямой, а опосредованной. Или считайте выпуск такого словаря крайне узкой или чрезвычайно изысканной рекламной акцией. Во всяком случае, меня на презентации посетила мысль довести суть проекта до абсолюта: выпустить двухтомник на веленевой (впрочем, на веленевой не сошьется, - на рисовой!) бумаге, в красном сафьяне, с золотым обрезом, возможно - с нумерованными экземплярами. И пусть цена его вырастет вчетверо, - человек, захотевший поставить на полку этот странный памятник современной старины, вряд ли вообще станет интересоваться его ценой.
Последней из пропущенных мною в "Огородах" презентацией - да и последней по времени, совсем уже недавней, - стала презентация очередной, девятой, версии FineReader’а, "Клевого Чтеца". Я работаю с FineReader’ом практически с момента его появления, не помню, с первой ли, но уж во всяком случае - со второй версии. Вторая была неважной, висла и плохо распознавала большинство текстов. Третья уже оказалась вполне работоспособной. В те поры я, помнится, проводил большую тестовую работу, скрупулезно сравнивая FineReader с аналогичной программой "Евфрат" главных конкурентов из Cognitive Technologies и целым рядом забугорных программ (разумеется, в первую очередь меня интересовало распознавание русскоязычных текстов). У буржуинов FineReader выигрывал вчистую и всухую, у "Евфрата" - менее разительно, но тоже безусловно. Четвертая версия FineReader’а - во всяком случае, для моих довольно скромных задач: оцифровки некоторых бумажных книг и распознавания обложек компакт-дисков, - казалась мне практически идеальной, и с тех пор я, хоть и менял версии по мере их выхода, принципиального изменения в этой части моей жизни не замечал. Но, конечно, каждая следующая версия была хоть чем-нибудь, да совершеннее предыдущей, и по поводу каждой авторы писали, что точность распознавания повысилась на столько-то и столько-то процентов. Насчет процентов я понимал (и понимаю до сих пор) очень мало: четвертая (если не третья) версия распознавала хороший типографский текст буквально стопроцентно, так что добавлять процентики к этой сотне получалось, как при подсчете голосов у нас на выборах где-нибудь на Кавказе, - а если тексты были, что называется, неудобными - точность распознавания зависела скорее от степени этого неудобства, чем от версии. Единственная претензия, которую я стал высказывать FineReader’у, после того как изумление от самого факта распознавания стало несколько утихать, - это некоторая его глупость - в том смысле, что, не разобрав, например, в списке одну из циферок, он не умел догадаться, что это список и, стало быть, непонятная фигура между шестеркой и восьмеркой должна быть, безусловно, семеркой.
Девятая версия получила новый интерфейс, соответствующий интерфейсной моде (ну, как у автомобилей), и - по пресс-релизу - добрые два десятка добавок: повышенная точность сохранения оформления документов, определение и восстановление логической структуры документа, сохранение колонтитулов, нумерации страниц и подписей к картинкам, автоматическое распознавания языка… и еще много подобных мелких приятностей, наверное, важных для перевода в цифру кипы каких-нибудь там документов, но не слишком существенных при редком распознавании отдельных художественных книжек. Другими словами, "девятка" принесла больше радостей корпоративным пользователям, нежели пользователям домашним. Впрочем, для домашних тоже появились свои удовольствия - вроде, например, режима распознавания повышенной точности, когда плохо пропечатанные буковки или жирное пятно на странице перестают быть непреодолимой преградой.
Голубицкому "девятка" вообще очень понравилась, так что о ценности этих нововведений, думаю, вам скоро будет поведано в "Голубятне", не стану отбивать хлеб. Что же касается поумнения (в смысле списков с обложек компакт-дисков), - я не заметил, чтобы в ABBYY особенно в этом направлении работали, - да и бог с ним.
Дело в том, что я почти перестал эти списки распознавать: приобретая новый диск, ты мгновенно находишь информацию с его обложки (и зачастую - даже гораздо больше информации) в Интернете, уже в цифровом виде. И это, кстати, относится отнюдь не только к дискам. По мере течения нашего цифрового времени все меньше оказывается надобностей в оцифровке текстов: книга попадает в Сеть либо (чаще всего) сразу в цифровом виде, либо сканируется и оцифровывается любителями раньше, чем возникает потребность получить ее как файл на свой КПК или Sony Reader. И хотя, как и прежде, я числю FineReader программой в числе первых, устанавливаемых на голую систему, - обращаться к нему стал все реже и реже.
И тут меня посетило интересное наблюдение: постоянно совершенствуясь в области распознавания текстов, ABBYY работает на концептуально, по вектору, отмирающем направлении. Число еще не переведенных в цифру культурных текстовых ценностей постоянно уменьшается, стремясь в пределе к нулю, новые текстовые ценности возникают сразу в цифровом виде, - то есть FineReader’ные усовершенствования напоминают мне старания какой-нибудь фирмы, стремящейся довести до идеала конструкцию паровоза: повысить КПД с семи до невероятных одиннадцати процентов, придать внешний лоск и все такое прочее. Разумеется, если б по тем или иным причинам на паровозы все еще был спрос, такие фирмы наверняка бы существовали. На распознавание текстов, а особенно - всяких бюрократических и финансовых документов, - спрос пока есть и падает куда медленнее (если вообще падает, а не растет), чем нам, энтузиастам безбумажности, хотелось бы, - так что ABBYY правильно делает, что на этом спросе зарабатывает. Но если посмотреть совсем концептуально… (Кстати сказать, подобные же мысли приходили мне в голову во время экскурсии на сверхсовременный завод по производству концептуально устаревающих - подобно тем же паровозам - винчестеров.)
Так или иначе, если пока не удается побороть бумажные лавины, циркулирующие по официальным каналам, - потребности в их обработке и оцифровке удовлетворять надо (тоже ведь прогресс: желание, хоть и оставаясь с бумагой, ее оцифровывать!), и ABBYY, судя по живейшему интересу партнеров, проявлявшемуся на турецком семинаре к совместимости интерфейсов с разными программами документооборота, - удовлетворяет их достойно.
О чем говорит и последняя новость: в Китае (уже и в Китае!) открылось отделение ABBYY, - и ее китайское название, первые иероглифы которого (Tai Bi), со слов пресс-релиза, должны "вызывать у носителей языка ассоциации с ощущением совершенства, радости, процветания и уверенности в завтрашнем дне", - я и вынес в заголовок нынешнего "Огорода" двойной протяженности.
Tai Bi Technologies - название компании ABBYY на китайском языке (www.abbyy.cn).
ПИСЬМОНОСЕЦ: Машины носятся как пули
Автор: Владимир Гуриев
Сергей Голубицкий в своей статье "Шлях-кормилец..." в #705 описал ситуацию, связанную с претензиями сотрудников ГИБДД по поводу совершения обгона транспортного средства, связанного с выездом на полосу встречного движения через прерывистую линию разметки (которая быстро заканчивается) и возвращением на свою полосу уже через спошную линию. Так вот, как юрист, ответственно заявляю, данные претензии необоснованны, потому что в таких действиях водителя нет состава административного правонарушения, предусмотренного ч. 4 ст. 12.15 КоАП РФ - нарушение правил обгона, так как, в соответствии с п. 11.4 Правил дорожного движения РФ, по завершении обгона водитель обязан вернуться на ранее занимаемую полосу движения; при этом, в случае выезда на полосу встречного движения, не имеет значения, через какую именно линию разметки водитель будет возвращаться на свою полосу - через прерывистую или сплошную. Таким образом, указанные сотрудники милиции пользуются в своих корыстных интересах не непредсказуемой сменой линий разметки, а правовой безграмотностью большинства водителей. Автор статьи совершенно правильно поступил, предоставив возможность суду рассмотреть его инцендент; уверен, решение будет в его пользу.
С уважением, Георгий
ОТ РЕДАКЦИИ: Я так понимаю, что береженого бог бережет. Если уж выехал на встречку, не сворачивай. Потому что у нас "указанных сотрудников милиции" под каждым кустом с десяток.
Ответьте мне на вопрос, участвовал ли Михаил Ваннах в передачах типа "Своя игра"? А то очень интересно узнать, кто круче - Ваннах или Вассерман?