Евгений Кунин - Логика случая. О природе и происхождении биологической эволюции
Рис. 4–3. Схематическая обобщенная картина корреляций эволюционных и молекулярно-фенотипических переменных.
Сильнейшая, универсальная связь между эволюционными и молекулярно-фенотипическими переменными состоит в отрицательной корреляции скорости эволюции белок-кодирующих генов и уровня экспрессии: высокоэкспрессированные гены эволюционируют медленно. Эта зависимость наблюдается у всех организмов, для которых есть данные по экспрессии генов (Drummond et al., 2006; Drummond and Wilke, 2008; Pal et al., 2001). Поскольку, как отмечено выше, существует положительная корреляция между Ка и Ks, неудивительно, что скорости эволюции синонимических и несинонимических сайтов связаны с уровнем экспрессии гена качественно одним и тем же образом. Более неожиданно то, что зависимость между экспрессией и скоростью эволюции соблюдается и для 3’-нетранслируемого участка (НТУ), хотя и не обнаружена для 5’-НТУ (Jordan et al., 2004). Эта универсальная отрицательная корреляция проявляется еще сильнее, если сравнивать скорость эволюции напрямую с экспериментально измеренными концентрациями белка (Schrimpf et al., 2009).
Открытие универсальной связи между экспрессией генов и их эволюцией стимулировало смелую попытку новой интерпретации, согласно которой эволюция белков определяется в большей степени принципами структуры и укладки белка, общими для всех организмов, чем его уникальными биологическими функциями. Было выдвинуто предположение, впервые – в работе Алана Драмонда и Клауса Вилке, о том, что главным фактором отбора в эволюции белка является его устойчивость к неправильной укладке. Согласно этой гипотезе, влияние мутации, как геномной, так и фенотипической (вызванной ошибками трансляции), на приспособленность организма в первую очередь рассматривается как следствие отрицательного эффекта от неправильной укладки белка, которая, помимо вызываемых ею энергетических издержек, может быть еще и токсичной для клетки (Drummond et al., 2005; Drummond and Wilke, 2008). Не углубляясь в детали, заметим, что эта интуитивно привлекательная модель может естественным образом объяснить отрицательную корреляцию между экспрессией генов и эволюцией генных последовательностей: очевидно, что негативный эффект от неправильной укладки должен быть выше для высокоэкспрессированных белков, чем для белков, производимых в небольших количествах. Другими словами, уровень экспрессии – это линза, которая увеличивает любое негативное влияние на приспособленность, связанное с данной последовательностью белков, и важнейшее из таких влияний обусловлено неправильной укладкой белка. Таким образом, гены высокоэкспрессируемых белков подвергаются бо́льшим ограничениям, следствием чего является низкая скорость их эволюции. Эта гипотеза совместима с твердо установленным принципом предпочтительного выбора кодона (среди синонимичных кодонов чаще встречается оптимальный)[37] в высокоэкспрессируемых и высококонсервативных белок-кодирующих генах, а также с положительной корреляцией между Ka и Ks. Согласно гипотезе эволюции, движимой ошибками укладки, эволюция синонимичных сайтов ограничена, по крайней мере частично, теми же самыми факторами, что и эволюция последовательности белка, поскольку выбор оптимального кодона, обеспечивающий более быструю и точную трансляцию, особенно важен для высокоэкспрессированных белков и для тех конкретных позиций, которые влияют на укладку белка. Таким же образом можно объяснить и эволюцию 3-НТУ – этот нетранслируемый участок используется для регуляции процесса трансляции.
Рис. 4–4. Модель «статуса генов».
В работе, выполненной совместно с Александром Лобковским и Юрием Вульфом, мы задались вопросом, не удастся ли в данном случае убить двух зайцев, то есть возможно ли объяснить эволюцию белок-кодирующих генов и практически повсеместную отрицательную корреляцию между эволюционными скоростями и уровнем экспрессии в рамках одной простой модели (Lobkovsky et al., 2010). В анализе эволюции, ведомой ошибками укладки, проводимом для «безрешеточной»[38] модели укладки белка, были получены оценки эволюционных скоростей для гипотетического случая, в котором ошибки укладки белка являются единственным фактором, влияющим на приспособленность организма. Результаты анализа воспроизвели, и весьма точно, универсальное распределение эволюционных скоростей белков, а также зависимость между скоростью эволюции и экспрессией. Этот результат позволяет предположить, что универсальный закон распределения скоростей эволюции и в самом деле вытекает из фундаментальных физических принципов укладки белка.
Слабость или даже отсутствие некоторых интуитивно ожидаемых корреляций между эволюционными и фенотипическими переменными кажутся не менее поразительными, чем обнаруженные корреляции. В самом деле, биологическая интуиция всей этой области знаний подсказывает, как было указано в начале этого раздела, что гены с большей «биологической значимостью» будут эволюционировать медленнее и будут теряться с меньшей вероятностью (Wilson et al., 1977). Общее понятие биологической важности можно конкретизировать измерением фенотипических эффектов от нокаута или других мутаций многих генов – желательно всех генов многих организмов. Можно предположить, что чем больше эффект от нокаута гена, тем медленнее этот ген будет эволюционировать, и гены, утрата которых вызывает летальный эффект, будут эволюционировать значительно медленнее генов, менее существенных для выживания. К настоящему времени проведено сравнение фенотипических эффектов нокаута генов и скоростей эволюционирования генов для множества модельных организмов и получен недвусмысленный и как будто парадоксальный результат: связь между экспериментально измеренной биологической важностью гена и скоростью его эволюции очень слаба, если вообще существует (Hurst and Smith, 1999; Jordan et al., 2002; Krylov et al., 2003; Wang and Zhang, 2009). Еще более удивительным кажется отсутствие сильной корреляции между скоростью утраты гена в течение эволюции, представляющей в некотором смысле временную меру биологической важности или существенности гена, и экспериментально определенным эффектом на приспособленность: только те наборы генов, которые вообще не утрачиваются на продолжительных отрезках эволюции, таких как вся эволюция эукариот, обогащены «важными» генами (Krylov et al., 2003; Wang and Zhang, 2009). Первые работы, показавшие почти полное отсутствие связи между скоростью эволюции и биологической значимостью, были основаны на простом измерении эффекта (присутствует/отсутствует) нокаута гена (соответственно, существенный/несущественный ген). Можно предполагать, что такие измерения слишком грубы и не дают осмысленной оценки биологической важности. Однако, например, в последних работах лаборатории Джорджа Занга было продемонстрировано почти полное отсутствие корреляции между скоростью эволюции и весьма точно измеренным влиянием на приспособленность пекарских дрожжей (S. cerevisiae) во множестве различных условий (Wang and Zhang, 2009), что уменьшает вероятность получения неадекватных результатов.
Чем же тогда объяснить неожиданно слабую связь между эволюцией и функцией гена? По отношению к эволюции последовательностей можно предположить, что скорость эволюции более зависит от внутренних характеристик гена (в особенности от структуры кодируемого белка), чем от его биологической значимости. Однако это объяснение неприменимо к случаям утраты гена. Наиболее осмысленным – хотя опять-таки противоречащим здравому смыслу – кажется следующее объяснение: фенотипический эффект нокаута гена (и в целом – набора необходимых генов) не проявляется как консервативное свойство в эволюционном процессе и быстро меняется (в масштабах эволюционной шкалы), вероятно благодаря высокой скорости эволюции сетей взаимодействующих генов[39]. Ясно, что это предположение можно проверить опытным путем, пусть и с помощью трудоемких экспериментов.
Почти нейтральные сети и белковая эволюция
В целом скорость эволюции гена определяется размером его почти нейтральной сети, то есть множества последовательностей, получаемых друг из друга в результате одношаговых мутаций (пусть и необязательно с помощью одной замены) и имеющих приспособленность примерно такую же, как и у наиболее приспособленной последовательности (Wagner, 2008a; Wolf et al., 2010). Чем больше нейтральная сеть, тем слабее ограничения для конкретного гена, тем быстрее он может эволюционировать (рис. 4–5).
Рис. 4–5. Почти нейтральная сеть и белковая эволюция. Две почти нейтральные сети для двух вымышленных белков схематично представлены как две области, находящиеся на широких вершинах пиков приспособленности.