Стивен Пинкер - Язык как инстинкт
Марк Твен однажды спародировал романтическое описание природы, сделанное скорее ради сладкозвучия, чем ради содержания:
Стояло хрустящее и ядреное утро раннего октября. Ветви сирени и «золотого дождя», зажженные факелами осени, висели горящие и пылающие в высоком воздухе — сказочный мост, созданный добросердечной Природой для бескрылых диких созданий, живущих на вершинах деревьев и навещающих друг друга взаимно; лиственницы и гранаты простирали свои пурпурные и желтые языки пламени подобно ярчайшим и обширнейшим всплескам краски вдоль покатого изгиба лесного массива; чувственное благоухание бесчисленных листопадных цветов поднималось в доводящий до обморока воздух; высоко в открытом небе одинокий эсофагус[35] спал на недвижном крыле; все было преисполнено покоя, торжественности и Божьего мира.
И почти что каждому знакомо стихотворение из «Алисы в Зазеркалье» Льюиса Кэрролла, которое заканчивается так:
Он стал под дерево и ждет, И вдруг граахнул гром —Летит ужасный Бармаглот И пылкает огнем!
Раз-два, раз-два! Горит трава, Взы-взы — стрижает меч,Ува! Ува! И голова Барабардает с плеч.
О светозарный мальчик мой! Ты победил в бою!О храброславленный герой, Хвалу тебе пою!
Варкалось. Хливкие шорьки Пырялись по наве.И хрюкотали зелюки, Как мюмзики в мове.
Перевод Д. Г. ОрловскойКак сказала Алиса: «Каким-то образом от этого у меня в голове появляются мысли, только я не знаю точно, какие!» И хотя здравый смысл и знание действительности, никак не способствуют пониманию этого отрывка, носители английского языка признают, что он грамматически правилен, а ментальные правила англоговорящих позволяют им вычленить точный, хотя и абстрактный, костяк смысла. Алиса сделала следующее заключение: «Кто-то кого-то здесь убил — по крайней мере это ясно…» А прочитав цитату Хомского в словаре Барлетта любой может ответить на вопросы типа: «Кто спал? Как? Спал кто-то один или их было несколько? Что это были за мысли?»
* * *Каковы же могут быть принципы работы комбинаторной грамматики, лежащей в основе механизмов работы человеческого языка? Самый легкодостижимый способ расставлять слова в неком порядке описан в романе Майкла Фрейна «Человек-жестянка». Главный герой по фамилии Голдвассер — инженер, работающий в научно-исследовательском институте проблем автоматизации. Он должен сконструировать компьютерную систему, которая будет выдавать стандартные истории, которые встречаются в ежедневных газетах, типа «Парализованная девушка собирается снова танцевать». В нижеприведенном отрывке он проводит ручное тестирование алгоритма, который будет составлять истории о событиях в королевской семье:
Он выдвинул ящик картотеки и выбрал первую карточку из набора. На ней было написано: традиционно. Теперь ему предстояло наугад выбрать одну из карточек, на которых значилось: коронации, помолвки, похороны, свадьбы, достижение совершеннолетия, рождения, смерти и первые причастия. За день до этого он выбрал похороны, и получил указание следовать к карточке, на которой с гениальной простотой было написано: поводы для скорби. В этот день он закрыл глаза, вытащил свадьбы и получил указание следовать к карточке: поводы для ликования.
За этим логически последовала карточка с надписью: свадьба X и Y, которая привела его к выбору между: не является исключением и знаменательное событие. В любом случае за этим следовало: и действительно. И действительно, как видел сейчас Голдвассер с чувством огромного математического удовольствия, откуда ни начать — с коронаций ли, со смертей или с рождений — все пути вливались в одно элегантное русло. Он повременил на слове и действительно, а потом в быстрой последовательности вытянул: исключительно радостное событие, редко когда и возможно ли представить себе столь же популярную молодую чету.
Из следующей выборки Голдвассер вытянул: в сердцах наших людей для X отведено особое место, что заставило его проследовать к: уже очевидно, что британский народ проникся к Y глубоким расположением.
Голдвассер был удивлен и слегка озадачен тем, что ему еще не встретилось слово «важность». Но он вытащил его со следующей карточкой: особенную важность представляет то, что.
Это выводило его на: жених / невеста, а дальше предоставлялся выбор между: принадлежит к такому древнему и прославленному роду, во времена демократизации общества не является аристократом, сын / дочь того народа, с которым у нашей страны давно уже сложились теплые дружественные отношения, и сын / дочь того народа, с которым у нашей страны отношения не всегда складывались безоблачно.
Чувствуя, что в прошлый раз ему очень удачно встретилось слово «важный», на этот раз Голдвассер вытащил его намеренно. Также важно — значилось на карточке, после чего быстро последовало: помнить о том, что и X и Y — не просто символы, а молодой человек в расцвете сил и юная женщина в расцвете красоты.
Голдвассер закрыл глаза, чтобы вытянуть следующую карточку. На ней значилось: в наши дни, когда. Он призадумался над выбором из: стало модно насмехаться над традиционными моральными и семейными ценностями и уже не модно насмехаться над традиционными моральными и семейными ценностями. Он решил, что последнее высказывание тоньше соответствует вычурной прелести предмета речи.
Давайте назовем это «генератор цепочек слов» (технический термин — «модель языка с конечным числом состояний», или «модель Маркова»). Генератор цепочек слов — это комплект из списков слов или заготовок для предложений и набор указаний для следования от списка к списку. Генератор строит предложение, выбирая слово из одного списка, затем — из другого и так далее. (Чтобы узнать сказанное кем-то предложение, нужно просто просмотреть одно за другим слова в каждом списке.) Системы для составления цепочек слов часто используются в сатирах типа упомянутого романа Фрейна, как рецепты типа «сделай сам» для сочинения подобных образцов словоблудия. Например, вот Генератор Общественнонаучного жаргона, которым читатель может воспользоваться следующим образом: выбрать наугад слово из первой колонки, затем — слово из второй, затем — из третьей и выстроить их друг за другом для создания весомо звучащего термина, например: inductive aggregating interdependence ‘индуктивная дополняющая взаимозависимость’.
диалектический — совместный — взаимозависимость
обессмысленный — дегенеративный — рассеивание
позитивистский — совокупный — периодичность
предикативный — носящий характер присвоения — синтез
многосторонний — симулированный — достаточность
количественный — однородный — равноценность
дивергентный — преобразующий — ожидаемость
синхронный — варьирующий — пластичность
дифференцированный — объединенный — эпигенез
индуктивный — прогрессивный — конструктивизм
объединенный — дополнительный — деформация
дистрибутивный — выделительный — отверделость
Недавно я видел генератор цепочек слов, который составляет захватывающие аннотации на книжных обложках, и другой такой прибор, составляющий тексты песен Боба Дилана.
Генератор цепочек слов — это простейший образчик дискретной комбинаторной системы, поскольку он способен создать неограниченное количество различных комбинаций из ограниченного количества элементов. Невзирая на пародии, генератор цепочек слов способен составить неограниченное количество наборов грамматически правильных английских предложений. Например, донельзя простая схема
позволяет составить много предложений, таких как: A girl eats ice-cream ‘Какая-то девочка ест мороженое’ или The happy dog eats candy ‘Эта радостная собака ест конфеты’. Эта схема позволяет составить неограниченное количество предложений благодаря петле наверху, которая может направить генератор от списка, представленного словом happy ‘радостный’, снова к этому же списку любое количество раз: The happy dog eats ice-cream ‘Эта радостная собака ест мороженое’, The happy happy dog eats ice-cream ‘Эта радостная радостная собака ест мороженое’, и т.д.
Когда инженеру требуется придумать систему для сочетания слов в определенном порядке, генератор цепочек слов — это первое решение, которое приходит в голову. Запись голоса, сообщающего вам телефонный номер, когда вы звоните в справочную — хороший тому пример. Там имеется запись произнесенных человеком десяти цифр, каждая из которых записана в семи различных интонационных моделях (одна соответствует первой цифре номера, одна — второй и т.д.). Имея всего семьдесят этих записей можно составить десять миллионов телефонных номеров; имея еще тридцать записей для трехзначных кодов областей, возможно составление десяти миллиардов номеров (на практике многие из них никогда не используются из-за налагаемых ограничений, например — на присутствие 0 или 1 в начале телефонного номера). В действительности, были сделаны серьезные попытки представить английский язык как одну большую цепочку слов. Чтобы сделать это по возможности реалистичным, переходы от одного списка слов к другому должны отражать действительную вероятность того, что такие типы слов могут следовать друг за другом в английском языке (например, существует бо́льшая вероятность того, что за словом that ‘это’ последует is ‘есть’, а не indicates ‘указывает’). Были составлены колоссальные базы данных этих «вероятностей последующего слова»; это делалось путем компьютерного анализа корпуса текстов на английском языке или опроса добровольцев, которым предлагалось назвать первые слова, пришедшие в голову после того, как они услышат данное слово или ряды слов. Некоторые психологи предполагали, что человеческий язык основан на громадной цепи слов, хранящейся в мозгу. Эта идея созвучна теориям реакции на раздражение: некое раздражение вызывает в качестве реакции произносимое слово, затем говорящий получает вызванную им самим реакцию, которая служит как дальнейший раздражитель, вызывая одно из нескольких слов в качестве очередной реакции и т.д.