Алло, робот - Кондратов Александр Михайлович
В принципе, конечно, можно. Hq тогда нельзя было бы заметить или исправить ошибку в языке.
Когда мы пишем «электростанця» вместо «электростанция», пропустив букву «и» в конце слова, то любой легко поймет смысл слова, а порой даже и не заметит ошибки.
В языке, где каждое сочетание букв имеет смысл, «электростанця» было бы не искаженной «электростанцией», а каким-то новым, самостоятельным словом. Еще хуже было бы с разговором — ведь малейшие колебания воздуха, изменение тембра голоса, смена настроения меняли бы звуковой состав речи и тем самым давали бы новые слова!
Таким образом, русский язык имеет своеобразный «запас прочности». Причем, как показали исследования, и в английском, и в русском, и в шведском, и в румынском, и в испанском, и во французском языках «запас прочности» примерно одинаков.
Иногда этот «запас прочности», называемый в теории информации «избыточностью языка», приходится искусственно повышать.
Например, деловая речь изобилует стандартными оборотами, разъяснениями, повторами. В результате одна буква деловой речи несет информацию не в 1 бит, а всего лишь в 0,6 бита.
Еще больше «запас прочности», еще больше избыточность в переговорах между дежурным по аэродрому и пилотом, находящимся в воздухе. Ошибка здесь может стоить жизни. Естественно, что «запас прочности» повышен до предела: одна буква несет информацию в 0,2 бита.
БИТЫ МЕРЯЮТ ПОЭЗИЮ
Интереснейшие работы были проделаны в нашей стране, где методами теории информации изучались поэтические произведения. Сколько битов информации несет одна буква поэзии?
С одной стороны, поэт располагает гораздо большей свободой, чем «простой смертный». Он может делать смелые сравнения, допускаемые в обычной речи; например, переставлять слова, что недопустимо правилами грамматики, но разрешается правилами «поэтического синтаксиса».
С другой стороны, поэт соблюдает строгие правила ритма и рифмы, а это ограничивает его свободу.
Одна буква обычной литературной речи несет, как мы уже говорили, один бит информации. Если взять 25 букв, среднюю длину поэтической строки, то мы получим 25 бит информации. Поэт располагает большей свободой; можно считать, что эта величина равна не 25, а 40 битам за счет неожиданных сочетаний слов, поэтического синтаксиса и других вольностей, дозволенных поэту.
Если поэт будет писать четырехстопным ямбом, самым популярным размером в русской поэзии («Евгений Онегин», «Руслан и Людмила», «Демон», «Ода к Фелице» и многие другие поэмы и стихотворения написаны ямбом), то его «расходы» информации будут равны примерно 5,5 бита. Чтобы придать звучанию стиха своеобразие, придется затратить еще 0,5 бита.
Требования рифмовки увеличивают эти «траты».
7 битов уйдет на то, чтобы соблюдать правила точной рифмы, и еще
1,5 бита на то, чтобы поэт мог выбирать своеобразные, «свои» рифмы, а не слепо следовать нормам стихосложения.
5,5 бита + 0,5 бита -f- 7,0 бита -f- 1,5 бита. 14,5 бита из 40 понадобится затратить поэту, чтобы придать своему стиху звуковую выразительность с помощью ритма и рифмы!
Но современные поэты пишут не только ямбом или другими классическими стихотворными размерами. Вспомните стихи В. Маяковского. Рифмы в них глубже и богаче, а ритмика стиха гораздо более свободна.
Подсчеты показывают, что на рифмовку, которой пользовался Маяковский и многие современные поэты, уходит не 8,5, а 10 битов. Зато на ритм затраты совсем незначительны — 2—3 бита, не больше.
Как видите, теория информации позволяет измерять не только телеграфные разговоры, но и такой сложнейший язык, как поэзия. Но не в измерении «емкости» стиха заключается главный смысл этой теории...
ЯЗЫК И КИБЕРНЕТИКА
Теория информации позволила изучать любые средства связи с помощью чисел. Информация, выраженная в битах, понятна и человеку и машине. Ее можно хранить, будь это железная память машины, живая память человека или животного, или искусственная память рукописей, магнитофонов, книг, фильмов. Ее можно передавать по самым различным каналам связи. Нервные волокна, радиоволны, электрический ток, световые волны — вот далеко не полный перечень каналов связи, которыми пользуется человек.
Наконец, информацию можно не только хранить и передавать, но и перерабатывать. Принимать с ее помощью решения, управлять. И раз мы пользуемся точными числами и мерами, то безразлично, кто это делает — человек ли, животное или автомат.
Эта всеобщность процессов передачи, хранения, переработки информации и привела к рождению новой науки — кибернетики. О кибернетике написано множество книг — научных и научно-популярных, специальных и общедоступных. Мы же хотим рассказать лишь об одной узкой проблеме кибернетики — о «разговоре» человека с машиной, об обмене информацией между автоматами и людьми.
Мы назвали эту проблему узкой. Это не совсем так. Чтобы перевести на машинный язык задачи языкознания, психологии, экономики и многих других наук, требуется, чтобы и сами эти науки овладели числами и точными мерами. Иначе они не смогут дать задания вычислительным машинам.
Да и сама проблема «разговора» человека с машиной находится на стыке многих наук. Как вводить информацию — сразу в виде двоичных чисел или, может быть, в какой-либо иной форме? Быть может, перевод на свой, «машинный язык» машина сделает сама? И все ли доступно переводу на числа, кто бы ни делал этот перевод, человек или робот?
Разработкой «машинного языка», языка программ и чисел занимаются математики и логики в содружестве с инженерами. Переводом знакомых систем, существующих в нашем обществе, на «язык машины» занимаются лингвисты в тесном контакте с программистами.
Не только проблемы специального «языка машины» волнуют ученых. G помощью машин можно лучше изучить и наш обычный, человеческий язык, и другие средства связи. Машины могут помочь переводчикам с иностранных языков. Они могут оказать огромную помощь в расшифровке древних письмен. Говорящие и читающие устройства могут быть «глазами» и «ушами» людей, лишенных зрения и слуха.
Но, пожалуй, самая существенная, самая важная помощь ожидается от «грамотных машин» в обработке и хранении всего огромного запаса сведений, накопленных человечеством за многие сотни и тысячи лет.
ТРИ ВЕЛИЧАЙШИХ БЛАГА
В НЕЗАПАМЯТНЫЕ времена было изобретено письмо — величайшее благо для человечества. Память людская забывчива, к тому же она может исказить давнопрошедшие события. Трудно хранить знания лишь в человеческом мозгу. Ему не под силу удержать весь богатейший запас сведений, возрастающий с каждым годом.
Благодаря письму люди в тысячи крат увеличивали емкость и точность своей памяти. Однако долгое время чудесное изобретение было доступно лишь немногим посвященным. Знатоками письма были избранные, священнослужители и жрецы. Кисточкой или зубом акулы, каменным резцом или иглой наносили они письмена на камни, глиняные плитки, деревянные дощечки и листы папируса.
И лишь сравнительно недавно, в XVI веке, появилось второе величайшее благо — книгопечатание. Сокровищницы знаний — книги стали доступны не узкому кругу людей, а сотням, тысячам, десяткам тысяч, миллионам.
Вместе с ростом числа читателей рос и поток различных книг. Уже к концу XVI века, лишь через полвека после изобретения печатного станка, вышло в свет около 40 тысяч книг. Чем дальше, тем больше. Вот несколько чисел, которые говорят красноречивее любых слов.
В нашей стране — 400 тысяч библиотек. В них хранится полтора миллиарда книг. Ежегодно в мире издается 200 тысяч различных книг и журналов, публикуется около 3 миллионов статей, печатается около 60 миллионов страниц технической литературы. Для ее хранения требуются полки длиной более трехсот километров.