Евгений Кунин - Логика случая. О природе и происхождении биологической эволюции
Рис. 6–2. Эволюция гена имеет сетевой вид на малых масштабах, но древовидный на больших. Изображение схематично описывает эволюцию четырех генов. История расхождения каждого гена была вычислена на модели произвольной гомологичной рекомбинации с экспоненциальным снижением частоты рекомбинации с расхождением последовательностей. На каждом шаге моделирования два дочерних гена расходились на постоянную величину (расхождение по принципу молекулярных часов) и либо подвергались гомологичной рекомбинации (что сводило разницу между ними к нулю), либо нет, сохраняя существующее состояние расхождения. После некоторого количества коротких периодов расхождений и рекомбинаций гены стохастически расходились достаточно далеко, чтобы (гомологичная) рекомбинация стала крайне маловероятной. После этой точки они продолжали расходиться без рекомбинации. На большом масштабе это выглядит как простое раздвоение на дереве-графе. Адаптировано из Koonin and Wolf, 2009a.
Форд Дулитл и Эрик Батист предположили и продемонстрировали на весьма убедительных примерах, что с помощью дерева можно легко описать отношения между объектами, которые отнюдь не связаны общей родословной, a потому «древесное мышление» не следует считать априорно применимым или, во всяком случае, центральным в биологии (Doolittle and Bapteste, 2007). Несмотря на то что аргумент этот сам по себе обоснован, в нем упускается из вида то принципиально важное обстоятельство, которого мы касались выше, а именно что дерево – это неизбежное формальное следствие истории репликации нуклеиновых кислот и последующей эволюции. Таким образом, деревья нельзя убрать из эволюционной биологии по фундаментальной причине: они изначально присущи эволюционному процессу. И тогда наиболее уместным вопросом становится такой: каковы фундаментальные генетические единицы, эволюция которых лучше всего представима деревом? В практике эволюционной биологии деревья чаще всего выстраиваются для отдельных генов или для наборов генов, которые, как считается, имеют общую историю. Однако обычно подразумевается (или даже недвусмысленно заявляется), что конечной целью является древо видов (организмов). Недостаток ясности в вопросе об основной единице, деревья которой должны строиться и анализироваться, является важным (если не главным) источником всей дискуссии вокруг ДЖ.
На концептуальном уровне ответ на заданный выше вопрос кажется ясным: фундаментальную единицу эволюции можно в целом удовлетворительно определить как самую малую порцию генетического материала с отчетливой эволюционной траекторией — то есть такую, которая развивается независимо от других таких же единиц на протяжении достаточно длительного эволюционного периода. На практике, учитывая динамический характер эволюции прокариот, описанный в главе 5, критерию фундаментальной единицы древовидной эволюции отвечает геномный локус, кодирующий РНК или белок (или индивидуальный эволюционный домен). (Очевидно, такая единица соответствует гену, за исключением мультидоменных белков.) В самом деле, как впервые явно отметил Ричард Докинз (Dawkins, 2006), гены в большой степени эгоистичны, то есть подвержены отбору, частично независимому от других генов. В условиях обширного ГПГ ген или оперон потенциально может оказаться в широком спектре организмов. Конечно, обычно это происходит, когда некий ген дает селекционное преимущество организму-носителю, поэтому эволюция генов и эволюция организмов тесно связаны.
Осознание того, что отдельные гены, в противоположность геномам, являются «атомами» эволюции, ставит под сомнение самую идею ДЖ. Тем не менее, как было показано выше, деревья невозможно убрать из какого бы то ни было описания эволюции, по той простой причине, что репликация генетического материала – процесс по сути своей древовидный. Эти два фундаментальных наблюдения вместе приводят к логичному заключению о том, что должно прийти на смену ДЖ: лес жизни (ЛЖ), то есть совокупность филогенетических деревьев всех генов (за очевидным исключением ОРС). В таком случае реконструкция истории жизни (ясно, что не всей истории полностью, но ее «скелета») не так проста, как анализ топологии ДЖ. Эта реконструкция требует картирования ЛЖ в поисках «рощ» подобных деревьев, которые могут быть отражением долгосрочных тенденций связанной (вертикальной) эволюции наборов генов, и «лиан» ГПГ. Представляется, что всестороннее исследование ЛЖ и есть главная цель филогенетики. В следующем разделе я преимущественно рассматриваю результаты недавних исследований ЛЖ, проведенных совместно с моими коллегами Пере Пуигбо и Юрием Вольфом (Puigbo et al., 2009, 2010). Это ни в коем случае не единственные исследования, сравнивающие филогенетические деревья и пытающиеся провести различия между вертикальной и горизонтальной тенденциями в эволюции. Однако эта работа соответствует современным требованиям, и мне кажется, что мы нашли пригодные способы для представления отношений между деревьями многочисленных генов, поэтому краткое изложение этих результатов дает хорошее представление о структуре ЛЖ. (Изложение в следующих двух разделах носит заметно более специальный характер, чем эта книга в целом; некоторые читатели могут решить сразу перейти к заключительным параграфам каждого раздела, а затем и к краткому обзору главы.)
Лес жизни и почти универсальные филогенетические деревья
В принципе в ЛЖ входят деревья для «всех» генов. Однако на деле работать с тысячью или около того геномных последовательностей прокариот (это число увеличится на несколько сотен к тому времени, когда эта книга будет опубликована) тяжело технически, поскольку максимально правдоподобные (maximum likelihood) методы построения деревьев, обеспечивающие наилучшее разрешение, тяжелы в вычислительном отношении (то есть плохо масштабируются с увеличением числа видов). К счастью, использование всех геномов, видимо, не так уж и важно. Несмотря на динамичную эволюцию прокариот, гены ядра и оболочки в близкородственных организмах (идентифицированные, к примеру, по высокому сходству последовательностей рРНК или других генов ядра) большую часть времени эволюционируют синхронно (a только гены ядра и оболочки распространены достаточно широко для получения информативных филогенетических деревьев). Таким образом, тщательно отобранного представительного набора организмов должно быть достаточно для определения главных тенденций в ЛЖ. Для исследований, которые здесь рассматриваются, мы сконструировали такой набор из 100 геномов прокариот, 41 архейного и 59 бактериальных (в дальнейшем в этой главе мы ссылаемся на эти прокариоты как на виды – с полным осознанием ограничений этой концепции, которые были отмечены в гл. 5). Деревья были построены для всех наборов ортологов с более чем четырьмя членами (минимальное число последовательностей, необходимых для построения бескорневого дерева), таким образом, в общей сложности мы получили 7000 деревьев. Как и ожидалось, с учетом структуры генного пространства прокариот из ядра, оболочки и облака, описанной в главе 5, большинство из этих деревьев маленькие: только 2040 состояли из более чем 20 видов, и лишь небольшой набор из 102 почти универсальных древ (ПУД)[59] включали более 90 процентов проанализированных прокариот.
Обычно филогенетики пытаются определить ГПГ путем сравнения деревьев отдельных генов с заданным заранее «древом видов». Однако, как мы увидели в предыдущем разделе, сама концепция «древа видов» сводится на нет всепроникающим ГПГ и эгоистичностью отдельных генов, которые являются фундаментальными единицами древовидной эволюции. Мы попытались исследовать структуру ЛЖ, не руководствуясь какой-либо предвзятой идеей стандартного древа, с которым следует сравнивать все остальные деревья. С этой целью мы проанализировали полную матрицу топологических расстояний между деревьями; это была довольно большая матрица, включающая почти 24 миллиона попарных сопоставлений деревьев, хотя многие клетки в матрице были пусты, потому что соответствующие деревья состояли из непересекающихся наборов видов.
На рис. 6–3 ЛЖ представлен в виде сети, где каждый узел соответствует дереву. Мы видим, что группа ПУДов занимает особое место в этой сети: около 40 процентов деревьев крайне похожи как минимум на один из ПУДов. (Два дерева считаются топологически подобными, когда различия в соединениях между их ветвями незначительны; из топологических различий высчитываются расстояния между деревьями. Подробности этих вычислений мы опустим.) Напротив, при использовании того же порога сходства 102 случайных дерева того же размера, что и ПУДы, были связаны всего лишь с примерно 0,5 процента деревьев в ЛЖ. Таким образом, существует высокое и неслучайное топологическое подобие между ПУДами и значительной частью ЛЖ.