Брайан Сайкс - Расшифрованный код Ледового человека: От кого мы произошли, или Семь дочерей Евы
Собрав воедино все европейские данные, мы решили попробовать расположить их так, чтобы выявить эволюционные взаимоотношения между ними. Такой подход прекрасно сработал в Полинезии, где мы сразу обнаружили две различные группы последовательностей и смогли выяснить их географическое происхождение. Почти сразу стало ясно, что с Европой нам предстоит повозиться. Когда мы запустили данные в компьютер и обработали их с помощью специальной программы, переводящей молекулярные последовательности в подобие эволюционного древа, результаты напоминали ночной кошмар. Компьютер очень долго соображал, а потом выдал тысячи вариантов, на вид одинаково жизнеспособных. Выбрать из них «правильное» древо, казалось, невозможно. Картина была просто безнадежная. Это был удар. Без приличной эволюционной схемы, объединяющей все европейские последовательности, вся наша трехлетняя работа превращалась в набор слабых и довольно бессмысленных, на мой взгляд, сопоставлений между популяциями и не самых остроумных выводов, например, что голландцы генетически ближе к немцам, чем, скажем, к испанцам. Ах, какая неожиданность, ну кто бы мог предположить.
Публиковать такое нам совсем не улыбалось, а по условиям гранта мы должны были напечатать что-то вроде отчета, если рассчитывали на продолжение финансирования. Прежде чем покориться печальной судьбе, мы еще раз вернулись к исходным данным. На сей раз мы не стали «кормить» ими компьютер, а вместо этого начали вручную чертить диаграммы на листках бумаги. Результаты по-прежнему не наполнялись смыслом. Например, у нас имелись четыре родственные последовательности, но даже их нам никак не удавалось расположить в приемлемую эволюционную схему. Посмотрите на схему 6а.
Последовательность А служила нам в качестве эталонной, последовательность В отличалась от нее одной мутацией в позиции 189, а у последовательности С мутация была в позиции 311. Пока все достаточно просто. Сначала была последовательность А, потом мутация 189 привела к появлению последовательности В. Аналогичным путем мутация 311 превратила последовательность А в последовательность С. Пока никаких проблем. Никакого противоречия. Но что прикажете делать с последовательностью D, в которой имеются мутации 189 прямо и 311? D могла появиться из В с добавлением мутации в пункте 311 (или из С), если там случилась мутация 189 (см. схему 6б). В обоих случаях было очевидно, что мутации, от которых все зависело, возникали больше одного раза. И повторялись в одних и тех же позициях. Неудивительно, что компьютер приходил в замешательство.
Не в силах разрешить противоречие он старательно вырисовывал оба варианта древа. Если же где-то на последующих этапах возникала новая двусмысленность, это приводило к построению четвертого древа. Еще одно — и машина изображала восемь вариантов и так далее. Нетрудно понять, что потребовалось не так уж много периодически повторяющихся мутаций, чтобы заставить компьютер плодить эволюционные схемы в сотнях и даже тысячах вариантов. Как же обойти это препятствие? Похоже, мы застряли. Всю следующую неделю, как только мне казалось, что ответ найден, я хватался за бумагу и начинал чертить, но всякий раз понимал, что и этот вариант не работает. Как-то я сидел в буфете, чертя бесконечные варианты схем на салфетках, и тут забрезжило решение. Нечего и пытаться построить безупречное древо. Надо отвлечься от неясностей и несоответствий в схемах. Вместо того чтобы ломать голову, какое выбрать древо, следует начертить вместо него квадрат (схема 6с).
Пора раз и навсегда признать — да, мы не знаем, какая дорога вела к появлению варианта D. Ну и нечего вообще ломать над этим голову. Как только я освободил себя от необходимости мучиться над этой дилеммой, остальное пошло легче. Я расслабился. Мне больше не грозила перспектива строить совершенное древо, выбирая из тысяч альтернативных вариантов. Строить надо было одну-единственную диаграмму в виде не древа, а сети. Эта сеть, безусловно, будет содержать кое-какие противоречия, по зато ее всеобъемлющая форма и структура будет наполнена информацией.
Мы тогда не знали о существовании немецкого математика Ханса Юргена Бандельта, который разрабатывал теоретическое обоснование как раз для подобного случая. Он искал оптимальный способ, позволяющий группировать последовательности ДНК с такими параллельными мутациями, как те, что мы находили в эволюционных диаграммах. Он связался с нашей командой, так как нуждался в реальных данных, и сразу стало ясно, что мыслим мы в одинаковом направлении и просто необходимо объединить усилия. Действительно, он тоже предлагал схему в виде большой сети, а не диаграммы. Отличие состояло в том, что Ханс Юрген подходил к процессу построения сеток со строгой точностью математика, и в этом заключалось то принципиальное и неоспоримое преимущество, без которого невозможно было обосновать применимость этих сетей вместо традиционных диаграмм в форме древа.
Преодолев важное препятствие, мы могли, наконец, сконцентрировать внимание на той картине, которая вырисовывалась по Европе. Если в Полинезии мы видели две четкие группы последовательностей, то наши европейские сети разбивались на многочисленные группы, связанные друг с другом. Все эти группы разнились друг от друга, но не так отчетливо, как в случае с островитянами, в том смысле, что каждая отличалась от других на меньшее число мутаций, чем полинезийские. Нащупать границы между ними было довольно трудно — мы с Мартином Ричардсом провели над этим пасьянсом много часов, решая, как лучше их группировать. Сколько групп получается — пять, шесть или, может, семь? Трудно было принять решение. Сначала мы выделили шесть групп. Потом мы вроде бы обнаружили признак, по которому самую большую группу можно было разделить на две меньшие по размеру. Это дало семь групп, или, как мы называли их, кластеров, которые, по нашему мнению, составляли основу всего коренного населения Европы.
В тот момент для нас самым важным было не точное количество кластеров, а сам факт их наличия. В статьях, опубликованных нами летом 1995 года, была представлена не аморфная бесструктурная масса данных, которая бы свидетельствовала о беспомощности авторов и отвратила других исследователей от желания работать с данными по Европе. Кластеры, конечно, были трудно различимы. Честно говоря, их почти невозможно было разглядеть. Однако примененная по отношению к ним система сеток (они проясняли картину) не оставляла никакого сомнения в существовании этих групп. Теперь у нас было семь кластеров, с которыми предстояло работать дальше. Можно было начинать исследовать, где именно обнаружен каждый из кластеров и каков их генетический возраст. Поскольку нам известна скорость возникновения мутаций в контрольном регионе митохондриальной ДНК, то, сопоставив с ней количество мутаций в каждом из семи кластеров, мы могли определить, сколько времени он эволюционировал. В полинезийском случае такой подход сработал наилучшим образом — тамошние два кластера успели набрать всего по нескольку мутаций, что соответствовало времени появления людей в Полинезии (три-четыре тысячи лет назад). Полинезийские генетические данные на разных группах островов, с разными мутациями у их жителей, прекрасно ложились на соответствующие археологические сведения о времени заселения этих островов. У жителей островов Самоа и Тонга, заселенных в первую очередь, количество мутаций было самым большим, а генетический возраст, который мы определили в три тысячи лет, практически совпал с данными археологии. Дальше на восток лежат Острова Кука, на которых число накопленных мутаций было меньше, и генетический возраст популяции меньше. В группах данных по Аотеароа (Новая Зеландия), последнего острова из числа заселенных полинезийцами, количество мутаций совсем мало, а генетический возраст самый юный.
Когда мы применили в точности тот же метод к данным по Европе, нас ожидал сюрприз. Мы ожидали довольно «молодых» данных, но все же не таких юных, как в Полинезии, за счет громадного влияния миграций (носителей сельскохозяйственного уклада жизни) с Ближнего Востока в последние десять тысяч лет, что непременно подчеркивали все учебники. Но генетический возраст шести из семи кластеров заметно превышал десять тысяч лет. Согласно той версии генетической истории Европы, на которой нас всех воспитывали, с развитием сельского хозяйства на Ближнем Востоке произошел демографический взрыв, в результате которого его народы медленно, но неуклонно двинулись в Европу, занимая пространства, негусто заселенные охотниками-собирателями. Очевидно, если бы это было правдой, генетический возраст митохондриальных кластеров, во всяком случае, большей их части должен был составлять десять тысяч лет или около того. Но такому условию соответствовал лишь один-единственный кластер из семи. Остальные шесть были намного старше. Мы еще раз проверили последовательности. Может, мы ошиблись, и мутаций на самом деле меньше? Нет. Мы еще раз проверили расчеты. Они были точны. Мы столкнулись с новой головоломкой, но все еще не подвергали сомнению установившуюся догму — пока не дошли до данных по баскам.