Слава Бродский - Страницы Миллбурнского клуба, 2
Вообще-то, как отмечалось во введении, я не собираюсь детально интерпретировать подобные взлеты и падения. При наличии гигантской мемуарной и исследовательской литературы о поэте, что бы я ни сказал, будет либо оспорено, либо заклеймено как противоречащее каким-то известным фактам, о которых я не знаю. Мне кажется, однако, что наличие подобных графиков может натолкнуть настоящих специалистов по О. Мандельштаму на какие-то новые идеи – по крайней мере, в них есть некая объективность, которая может ускользнуть при традиционном историко-филологическом анализе. Ну а рядовые читатели, типа меня, могут еще раз подивиться, как причудлива человеческая психика, соединенная с такими неувядающими силами, как талант и время. И это еще не все, что статистика может рассказать.
3. Что с чем связано – анализ корреляций
Короткий анализ, проделанный выше, насчет возможной связи между активностью в 1920 году и любовной лирикой, является аналогом установления корреляций. На его основе можно было бы предположить, что если бы, скажем, поэт сильно влюбился еще один раз, то снова была бы резкая активность в стихах. Но чего не было – того не было. Рассмотрим подробнее, что с чем связано, то есть проведем так называемый корреляционный анализ.
3.1. Динамические связи – какие стихи пишутся одновременно
В общем случае, чем чаще те или иные свойства встречаются в различных стихах, тем выше корреляция свойств между собой. Корреляция измеряется специальным коэффициентом, который близок к единице, когда какие-то свойства почти всегда встречаются вместе, и принимает отрицательные значения, когда они совместно встречаются редко. Например, если «Новая власть +» будет часто сопутствовать «Удачным строкам» – корреляция «Новая власть +» и «Удачные строки» будет положительной. Но если в одобряющих новую власть стихах «Евреи» встречаются реже обычного – корреляция «Новая власть +» и «Евреи» будет отрицательной.
Для лучшего уяснения этой концепции взгляните еще раз на рис.1. Там можно увидеть, что «пики» и «ямы» у признаков «Прочее» и «Удачные строки» часто (но не всегда) совпадают. Это и означает, что между ними довольно высокая корреляция – в данном случае 0.62. Те же совпадения еще более заметны между «Всеми стихами» и «Лирикой», что и отражается в более высоком коэффициенте (0.89). Такого рода связь можно назвать динамической - она показывает, как ведут себя различные свойств поэтики во времени, причем учитывается не только наличие, но и отсутствие этих свойств. Если, например, за многие годы не было ни Тревоги, ни Лирики, а потом в один год появилось и то и другое, - корреляция будет высокой. Этот эффект объясняет возможное недоумение: нельзя ожидать, что при наличии высокой корреляции почти все тревожные стихи лиричны, а почти все лиричные - тревожны. Можно лишь заключить, что количество лиричных стихов имело подъемы и спады в то же время, что и количество тревожных, то есть поэту свойственно выражать себя именно в этом сочетании.
Другой способ измерения связи может быть назван статическим или структурным. Если взять все 538 стихотворений и подсчитать, как часто среди них, например, «Тревога» встречалась вместе с «Лирикой» в одном и том же стихотворении - то динамика будет игнорирована. Но зато мы получим представление о том, насколько типично совмещение разных свойств в творчестве поэта на всем протяжении его деятельности. Статические (структурные) корреляции рассмотрены в 3.2.
Удобнее всего рассматривать отношения такого рода, используя корреляционную матрицу, из которой видно, как каждый признак связан с любым другим. Но еще более наглядный способ понять взаимосвязи – применить специальную технику (так называемое многомерное шкалирование), которая позволяет проецировать все признаки на плоскость таким образом, что, по возможности, тесно коррелированные признаки находятся близко друг к другу, а некоррелированные – далеко. Такая проекция приведена на рис. 4. Если сравнить матрицу корреляций и ее проекцию, то выводы будут практически одинаковы. Например, «Лирика» и «Темные строки» в матрице имеют значение корреляции 0.81, то есть весьма высокое (близкое к единице) – и на рис. 4 они находятся близко друг к другу; «Детские стихи» в матрице не коррелированы ни с одним признаком – на рисунке они расположены вдали от всех признаков и т.д. Рассмотрим теперь, какие выводы можно из всего этого сделать.
В первом, наиболее плотном ядре находится несколько тесно связанных признаков: «Лирика», «Новая власть +», «Удачные строки», «Темные строки» и «Все» (я также отношу сюда «Тревогу», у которой сильные связи со всеми перечисленными признаками). Этот последний признак – «Все» – интерпретируется следующим образом.
Рис. 4. Проекция различных свойств поэтики О. Мандельштама
(чем точки ближе друг к другу – тем выше динамическая корреляция между свойствами)
Общее число стихов менялось год от года (о чем подробно говорилось выше в разделе 3.1), и каждый раз соответствующим образом менялось количество, скажем, лирических стихотворений, что отражено высоким коэффициентом корреляции. Но такой эффект не обязателен для других характеристик: например, объем детских стихов совершенно не связан с общим объемом всех стихов (корреляция равна нулю). Так что «Все» в данной группе – это интересный индикатор того, какие именно темы (свойства) были характерны для поэта в периоды подъемов и спадов его общей активности. Выясняется, что увеличение (уменьшение) объема написанного у О. Мандельштама тесно связано с увеличением (уменьшением) личностного момента и тревожности. Кроме того, у него синхронно меняется количество как удачных, так и темных строк. То же самое верно для признака «Новая власть +».Но, поскольку эта власть появилась лишь во второй половине его жизни, корреляция несколько менее надежна. Остановимся на этом подробнее.
«Все стихи» и «Лирика» сильно пересекаются, около половины всех написанных строк принадлежат лирическим стихотворениям, поэтому не удивительно, что их динамическая корреляция высока. Вполне можно сказать, что О. М. – это по преимуществу лирический поэт, что не есть крупное научное открытие. Куда интереснее посмотреть на остальные тесно связанные свойства (рис. 5).
Рис. 5. Динамика тесно связанных показателей, количество слов в неделю
Этот график ясно иллюстрирует природу динамических корреляций. Если стихи с определенными свойствами (например, «Тревога» и «Новая власть +») интенсивно писались в одно время и не писались в другое – что-то в душе поэта соответствовало и тому и другому. Другой интересный взгляд на динамику творчества может дать наблюдение за долями стихов того или иного типа во времени. На рис. 6 приведен такой график для трех важных характеристик.
Рис.6. Доли стихов различных типов во времени, %
Из графика видно, в частности, что в некоторые годы (1921 и 1933‑й) доля удачных стихов поднимается до огромного уровня в 60-70%. Но надо иметь в виду, что в эти годы писалось сравнительно мало (особенно в 1921-м: 3.8 слов в неделю по сравнению со средним уровнем 25.3). Аналогично – с тревожными стихами. Характерно и довольно неожиданно, что доля тревожных стихов в последние годы жизни сравнительно мала: после всплеска тревожности в 1931-м (22.8% всех стихов) она падает до 2.4% в период с 1932 по 1937 год (среднее за все годы – 8%). А вот объем стихов с темными строками, наоборот, вырос: не только 1935 год является рекордным (28% всех стихов содержат темные строки), но и в среднем за годы с 1932-го по 1937-й их доля (15.3%) выше среднегодовой (7.5%) в два раза. Это наблюдение корреспондирует с другим: общая доля темных стихов в составе тревожных за весь период очень мала (4%), что противоречит некоему общему ощущению, что в тревожном состоянии «невнятица в мозгах» повышается (см. подробнее в разделе 3.3).
Прежде чем приводить конкретные примеры, поясняющие сказанное, лучше рассмотреть сначала, были ли прямые пересечения мотивов, то есть как много стихотворений, в которых непосредственно сочетаются различные свойства.
3.2. Статические корреляции – что происходит внутри стиха
Самый простой и наглядный способ посмотреть, как сочетаются признаки между собой – это найти так называемое пересечение двух признаков, то есть установить, сколько стихов содержат оба признака одновременно. Если, например, в стихах с удачными строками содержится 3,000 слов, а в тревожных стихах – 2,000 (то есть меньше, чем в хороших), причем в стихах и хороших, и тревожных имеется 500 слов, то коэффициент близости определяется как 500/min(2000,3000) = 500/2000 = 0.25. Интерпретация: «25% тревожных стихов являются хорошими». Коэффициент всегда не меньше нуля и не больше единицы. Получается, что такая мера связи не является симметричной, ибо если мерить пересечение иначе, результат будет 500/3000=16.7%. Значения некоторых коэффициентов такого рода приведены в табл. 2. Все признаки упорядочены: слева находятся наименьшие, размеры которых использовались в знаменателях дроби. Это облегчает чтение таблицы: процент всегда определяется как доля пересечения к объему того признака, который указан по строке. Приведен только небольшой фрагмент полной таблицы, в котором имеются достаточно высокие значения пересечения, интересные для комментариев, так как они подчеркивают неочевидные закономерности.