Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 2)
Кроме того, применять методику распознавания авторов к текстам МАЛОГО объема следует чрезвычайно осторожно. Возникающие здесь трудности можно проиллюстрировать на примере крупных и мелких произведений А.П. Чехова. Параметр 3 (процент служебных слов) был просчитан вдоль всех его произведений в собрании сочинений 1960–1964 гг., Москва. Оказалось, что параметр 3 ведет себя следующим образом:
мелкие рассказы / большие тексты / номер тома | I | II | III | IV | V | VI | VII | VIII / процент служебных слов
22,6 22,5 23,4 22,7 23,4 25,4 25,5 25,4.
Разница между значениями параметра 3 для ранних МЕЛКИХ рассказов Чехова (I–V тома) и для более КРУПНЫХ повестей и рассказов позднего периода его творчества (VI–VIII тома) достаточно ощутима. См. рис. Доп-3.8. Причем в ранних МЕЛКИХ рассказах не только МЕНЬШЕ служебных слов, но главное заключается в том, что разброс их больше, чем в последующих КРУПНЫХ произведениях. БОЛЬШИЕ (поздние) тексты Чехова характеризуются ВЫСОКОЙ СТАБИЛЬНОСТЬЮ авторского инварианта, как впрочем и для всех других 26 авторов БОЛЬШИХ текстов из нашего списка. В этом смысле Чехов не выделяется на их фоне — параметр 3 прекрасно «обслуживает» все его БОЛЬШИЕ сочинения.
В заключение отметим еще одно интересное обстоятельство. Оказалось, что процент служебных слов наиболее стабилен (при величине порций в 8000 и 16000 слов) на ПРОЗАИЧЕСКИХ произведениях и менее устойчив на ПОЭТИЧЕСКИХ текстах. Этот вопрос заслуживает отдельного рассмотрения и здесь мы не будем на нем останавливаться.
Обнаружение авторского инварианта в русском литературном языке делает весьма правдоподобным гипотезу о существовании аналогичных авторских инвариантов и в других языках. Они могут, конечно, отличаться от процента служебных слов. Особый интерес представляли бы авторские инварианты греческого и латыни, если иметь в виду применения аналогичных методик для распознавания авторства древних текстов.
11. Статистический анализ творчества М.А. Шолохова
Авторский инвариант «Тихого Дона» резко отличается от авторского инварианта других произведений М.А. Шолохова
Внимательный читатель наверное уже отметил, что из исследованного нами списка 28 писателей почему-то один выпал. Это — Михаил Александрович Шолохов, к исследованию произведений которого мы сейчас и переходим. Все наши выводы мы основываем на анализе его сочинений, изданных в 8 томах в Москве в 1962 году.
Сразу же отметим, что мы ни в коей мере не претендуем на какие-либо окончательные выводы и публикуем полученные нами результаты в надежде, что они возможно окажутся полезными для исследователей творчества Шолохова.
Всем известно, что М.А. Шолохов достиг весьма видного положения в отечественной и мировой литературе. Нобелевская премия 1965 года также говорит о его международном признании.
Тем не менее, в течение нескольких десятков лет как у нас в стране, так и за рубежом, среди некоторой части специалистов высказываются сомнения относительно того, является ли М.А. Шолохов автором романа Тихий Дон или он написан казацким писателем Федором Дмитриевичем Крюковым (1870–1920), служившим в Донской белой армии и умершим от тифа в 1920 году.
Сразу оговоримся, что мы ни в коей мере не собираемся включаться в этот спор на той или другой стороне, а хотим лишь сообщить о статистических результатах наших исследований в надежде, что они могут оказаться полезными для исследователей творчества М.А. Шолохова и Ф.Д. Крюкова.
Вкратце напомним фабулу спора.
Хорошо известно, что во время первой мировой войны и гражданской войны в России Ф. Крюков много писал о донском казачестве. После его смерти, как утверждает, например, автор, избравший себе псевдоним «Д» (его исследование «Стремя Тихого Дона» [р11] вышло в свет в 1974 году), крюковская рукопись Тихого Дона, а возможно и другие материалы, каким-то образом попала к Шолохову, который якобы сделал ряд исправлений, заглушил казацкий национализм в оригинале Крюкова более просоветскими взглядами и опубликовал роман под своим именем. См. [р21].
«Д» утверждал далее, что язык и стиль текстов Крюкова обнаруживает значительное сходство с языком и стилем Тихого Дона. По его мнению 95 % текста I и II книг Тихого Дона и 68–70 % текста III и IV книг Тихого Дона принадлежат якобы перу Крюкова, а Шолохов может быть лишь соавтором. Обращает на себя внимание то обстоятельство, что Крюков был именно казацким писателем и потому хорошо знал быт и историю казаков.
В Предисловии к книге «Д» А. Солженицын писал: «С самого появления своего в 1928 году „Тихий Дон“ протянул цепь загадок, не объясненных и по сей день. Перед читающей публикой проступил случай небывалый в мировой литературе. 23-летний дебютант создал произведение на материале, далеко превосходящем свой жизненный опыт и свой уровень образования (4-классный). Юный продкомиссар, затем московский чернорабочий и делопроизводитель домоуправления на Красной Пресне опубликовал труд, который мог быть подготовлен только долгим общением со многими слоями дореволюционного донского общества, более всего поражал именно вжитостью в быт и психологию тех слоев».
Утверждения «Д» были подвергнуты резкой критике Ермолаевым [р15], [р16]. С другой стороны, выводы «Д» были поддержаны А. Солженициным и Р. Медведевым.
Кстати, как отмечают авторы книги [р18], в мае 1990 года Н.А. Струве — издатель книги «Стремя Тихого Дона», раскрыл псевдоним «Д». Автором оказалась известный литературовед И.Н. Медведева-Томашевская [р18], с. 7.
В 1991 году вышла книга А.Г. Макарова и С.Э. Макаровой «Цветок-татарник. К истокам Тихого Дона» [р18]. Анализируя язык романа, его историческое и хронологическое содержание, сравнивая текст романа с другими письменными материалами, сохранившимися от других авторов, А.Г. Макаров и С.Э. Макарова приходят к выводу, что Шолохов обработал и издал под своим именем произведение другого писателя.
Следует отметить, что в плагиате Шолохов обвинялся еще в 1928 году, как только в свет вышли первые две книги Тихого Дона.
Вопрос об авторстве Крюкова поднимался и родственниками Крюкова, но их претензии были отвергнуты из-за отсутствия прямых доказательств.
Но всякого рода слухи, не подкрепленные фактами и специальными исследованиями, не являются убедительными доказательствами.
В связи с этими утверждениями и усилившимися дискуссиями по этому поводу, два шведских и два норвежских исследователя подвергли тексты Шолохова компьютерному исследованию [р10], [р13], [р14]. Подробности см. в книге [р10], изданной в 1984 г. и в русском переводе в 1989 г.
Анализируя различные частотные характеристики (длину предложений, длину слов и т. п.), они пришли к выводу, что все части романа «Тихий Дон» по своему стилю принадлежат Шолохову.
Однако мы уже показывали выше, что такие и аналогичные им параметры в некоторых случаях либо вообще не стабилизируются, либо недостаточно чувствительны для распознавания авторства. В этом легко убедиться, если сравнить длины предложений и слов вдоль всех произведений Шолохова, изданных в 1962 году в 8 томах.
Произведения Шолохова / Среднее количество слов в предложении / Среднее количество слогов в слове.
Том I — Рассказы…………..9,17………..2,18
Том II — Тихий Дон………….8,73………..2,27
Том III — Тихий Дон………….9,85………..2,32
Том IV — Тихий Дон………….9,30………..2,31
Том V — Тихий Дон………….9,66………..2,21
Том VI — Поднятая целина…….8,77………..2,19
Том VII — Поднятая целина…….10,70……….2,15
Том VIII — Рассказы и повести….10,30……….2,28
Мы видим, что если среднее количество слов в предложении здесь колеблется, то среднее количество слогов в слове сохраняется более или менее постоянным. Поэтому, опираясь на поведение числа слогов в слове, при желании можно сделать вывод в пользу Шолохова. Но такой поспешный вывод был бы преждевременным, поскольку, как мы уже знаем, ни один из этих параметров АВТОРСКИМ ИНВАРИАНТОМ НЕ ЯВЛЯЕТСЯ.
Надо сказать, что указанные исследователи (см. [р10]) не обнаружили ни нашего инварианта (процент служебных слов), ни какого-либо другого, эффективность которого основывалась бы на исследовании БОЛЬШОГО ЧИСЛА ДРУГИХ АВТОРОВ.
Естественно, что у нас возник интерес, не столько из-за удовлетворения своего любопытства, хотя и это мы не исключаем, сколько для проверки разработанного нами метода, предназначенного как раз для подобных целей.
Ознакомление с доступными нам работами на эту тему показало, что обычно исследовали сравнивали различные частотные характеристики произведений Шолохова с произведениями например Крюкова, не выходя за рамки произведений двух писателей. Из этого сравнения извлекались те или иные выводы (иногда в пользу Шолохова, иногда в пользу Крюкова или других претендентов).