Евгений Кунин - Логика случая. О природе и происхождении биологической эволюции
Относительный вклад каждого из этих классов генов в наборы генов различных вирусов зависит от размера вирусного генома и его генетической сложности, которые разнятся более чем на три порядка (см. рис. 10-1). Вирусы с малыми геномами, такие как большинство РНК-вирусов, часто обладают лишь несколькими генами, большинство из которых принадлежат к классу генов-сигнатур. Напротив, у вирусов с большими геномами, например поксвирусов, широко представлены все пять классов. Чтобы проиллюстрировать разнообразие генетического состава, на рис. 10-2 показана разбивка набора генов трех вирусов, обладающих малым, средним и крупным геномами соответственно, на пять классов генов. Интересно, что крупные и среднего размера геномы бактериофагов и вирусов архей заполнены «сиротами», которые зачастую составляют более 80 процентов генов этих вирусов. Быстро эволюционирующие «гены-сироты» фагов, возможно, поставляют много, если не большинство «генов-сирот», которые находят в геномах прокариот (несмотря на отсутствие выявляемой консервативности последовательностей), так что они играют ключевую роль в эволюции прокариот (Daubin and Ochman, 2004).
Происхождение пяти классов вирусных генов, скорее всего, различно. Два класса генов, имеющих легко распознаваемые гомологи в клеточных формах жизни, вероятно, представляют собой соответственно относительно недавние (класс 1) и древние (класс 2) заимствования из геномов клеточных хозяев. Откуда произошли вирус-специфические гены – это значительно более трудный и интересный вопрос. Первая возможность заключается в том, что эти гены произошли от других генов вирусов или хозяев, но резкое ускорение эволюции, связанное с появлением новых, специфических вирусных функций, стерло все следы их происхождения. Это соображение согласуется с тем фактом, что многие (возможно, большинство) генов 4-го класса (вирус-специфических генов, консервативных среди группы вирусов) – компоненты вириона, то есть несут важнейшую для вируса функцию, для которой нет эквивалента у клеточных форм жизни. Мы пока отложим обсуждение других путей возникновения и эволюции вирус-специфических генов и обсудим эволюцию вирусных генов-сигнатур. Гены-сигнатуры, пересекающие границы, пролегающие между самыми разными эволюционными линиями вирусов, – глубоко интересный и значимый объект для понимания эволюции и происхождения вирусов.
Таблица 10-1. Наиболее крупные монофилетические классы вирусов и эгоистичных генетических элементов.
Сокращения: JRC – белок капсида с укладкой типа рулета; LTR – long terminal repeat (длинный концевой повтор); RdRp – РНК-зависимая РНК-полимераза; RCRE – (инициирующая) эндонуклеаза репликации по механизму «катящегося кольца»; RT – обратная транскриптаза; S3H – геликаза суперсемейства 3.
1 Уже после выхода этой книги автору посчастливилось участвовать в работе, где из горячего источника в Йеллоустонском парке, населенного исключительно гипертермофильными кренархеотами, методами метагеномики был выделен и секвенирован РНК-геном нового вируса, очень отдаленно родственного разным семействам позитивных РНК-вирусов эукариот (Bolduc B, Shaughnessy DP, Wolf YI, Koonin EV, Roberto FF, Young M. Identification of novel positive-strand RNA viruses by metagenomic analysis of archaea-dominated Yellowstone hot springs. J Virol. 2012 May;86(10):5562-73). Скорее всего, этот вирус представляет новое суперсемейство позитивных РНК-вирусов, которые, возможно, размножаются в археях. Прямые данные, подтверждающие (или отвергающие) это предположение, еще предстоит получить. Если гипотеза подтвердится, наши представления об эволюции этого класса вирусов могут потребовать существенного пересмотра (см. ниже).
Гены – вирусные сигнатуры: сигналы из древнего мира вирусов
Помимо больших классов, перечисленных в табл. 10-1, отчетливых вертикальных родственных отношений между крупными группами вирусов не существует. Однако значительное число генов, кодирующих белки, которые играют ключевую роль в репликации генома, экспрессии и морфогенезе вирионов, входят в пересекающиеся наборы генов, принадлежащие группам вирусов, казалось бы не родственных ни в каком другом отношении, хотя ни один из этих генов не присутствует у всех вирусов (см. табл. 10-2). Большинство генов – вирусных сигнатур не имеют высококонсервативных гомологов у клеточных форм жизни (исключения – легко распознаваемые провирусы и мобильные генетические элементы), хотя отдаленные гомологи бывают. Два наиболее широко распространенных среди вирусов гена кодируют белок капсида с так называемой укладкой типа рулета и геликазу суперсемейства 3. Оба этих белка пересекают барьер между ДНК– и РНК-вирусами и появляются в поразительно широком ассортименте групп вирусов, от некоторых самых мелких РНК-вирусов с позитивным геномом до крупных нуклеоцитоплазматических ДНК-вирусов, класса вирусов, включающего гигантский мимивирус (см. табл. 10-2). Уточняя, можно сказать, что белок капсида с укладкой типа рулета – главный строительный блок икосаэдрических (сферических) вирусных капсидов, наиболее частой формы капсидов, которые крайне различны по величине, но довольно сходны по симметрии и общей форме среди всего огромного диапазона вирусов, которые используют разнообразные стратегии репликации-экспрессии и заражают хозяев, представляющих все или почти все разнообразие клеточной жизни. Так, геликаза суперсемейства 3 участвует в репликации геномов огромного разнообразия РНК– и ДНК-вирусов.
Рис. 10-2. Разбиение вирусных генов на пять эволюционных классов: вирус, обладающий малым геномом: полиовирус (7,4 Кб); вирус, обладающий геномом промежуточного размера: Sulfolobus turreted icosahedral virus (STIV); вирус, обладающий крупным геномом: вирус осповакцины (195 Кб). Данные по Koonin et.al., 2006.
Другие белки, перечисленные в табл. 10-2, не столь широко распространены, как белок капсида с укладкой типа рулета и геликаза суперсемейства 3, но все же за их счет формируются множественные непредвиденные связи между группами вирусов, во всех других отношениях казавшихся неродственными. В качестве примера можно рассмотреть эндонуклеазу инициации репликации по механизму «катящегося кольца», которая объединяет огромное разнообразие небольших репликонов одноцепочечных и двухцепочечных ДНК, включая вирусы, плазмиды и транспозоны, которые размножаются в животных, растениях, бактериях и археях. Детальный анализ аминокислотных последовательностей показал, что ДНК-связывающий домен репликативного белка вирусов полиомы и папилломы (например, T-антигена SV40) представляет собой неактивную производную форму эндонуклеазы инициации репликации способом «катящегося кольца» (Iyer et al., 2005). Таким образом, посредством детального исследования одного из белков-сигнатур хорошо известная связь между различными небольшими репликонами оцДНК (вирусов и плазмид) распространилась также на группу репликонов дцДНК такого же размера. Подобное расширение набора вирусных групп, охватываемых определенным геном-сигнатурой, произошло также в результате детального анализа АТФазы, отвечающей за упаковку вирусной ДНК в капсид, и праймазы архей и эукариот, участвующей в инициации репликации ДНК (Iyer et al., 2005; Iyer et al., 2004b; см. табл. 10-2).
Репликация генома РНК-вирусов с позитивным геномом, дцРНК-вирусов, вирусов с негативным геномом и обратно транскрибирующихся вирусов (элементов) катализируется другим классом ферментов – вирусных сигнатур: РНК-зависимыми РНК-полимеразами и обратной транскриптазой. Полимеразы РНК-вирусов с позитивным геномом и обратная транскриптаза образуют монофилетическую группу внутри обширного класса так называемых palm-доменов («домены-ладони»), характерных для различных полимераз (Iyer et al., 2005; Koonin et al., 2008). РНК-зависимые РНК-полимеразы дцРНК-вирусов и вирусов с негативным геномом, скорее всего, сильно измененные производные того же полимеразного домена (Delarue et al., 1990; Gorbalenya et al., 2002; Koonin et al., 1989). Этот ген-сигнатура может привести нас к самым ранним этапам эволюции жизни, к миру РНК (см. гл. 11 и 12 – там гораздо подробней) и началу мира вирусов. Palm-домен, вероятно, является изначальным белком-полимеразой, сменившим рибозимные полимеразы (гипотетического) мира РНК. Это предположение поддерживается не только широким распространением palm-домена среди современных форм жизни, но еще и структурной, а следовательно, и эволюционной связью между palm-доменом и доменом, содержащим РНК-распознающий мотив (RRM, RNA Recognition Motif), древний РНК-связывающий домен, который первоначально, возможно, способствовал репликации рибозимов (Aravind et al., 2002). РНК-зависимые РНК-полимеразы и обратные транскриптазы исключены из основного хода репликативного цикла клеточных форм жизни, хотя большинство эукариотических геномов, особенно растений и животных, включает в себя множество копий RT-кодирующих ретроэлементов; у прокариот тоже есть немного подобных элементов (см. также гл. 5 и 7). Эти элементы, однако, эгоистичны и с эволюционной точки зрения принадлежат миру вирусов. Возможно, наиболее впечатляющее вторжение обратной транскриптазы в мир клеток – это каталитическая субъединица эукариотической теломеразы, важнейшего фермента, участвующего в репликации концов хромосом[107]. Конечно, не стоит забывать, что все интроны эукариот произошли от ретроэлементов прокариот (см. гл. 7). Примечательно, что единственная другая известная РНК-зависимая РНК-полимераза, не родственная полимеразам, содержащим palm-домен, и являющаяся компонентом системы РНК-интерференции эукариот (см. гл. 7), также, по-видимому, имеет вирусное происхождение (Iyer et al., 2003).