Люди. По следам наших миграций, приспособлений и поисков компромиссов - Луис Кинтана-Мурси
Реконструкция прошлого популяций
Теоретические модели, разработанные во второй половине XX века, позволили нам понять, какой вклад каждый из факторов вносит в генетическое разнообразие популяций, а также создавать прогнозы геномного разнообразия для различных демографических сценариев. Благодаря этому популяционная генетика получила возможность дальнейшего развития. На основании многочисленных доступных на сегодняшний день данных о геномах популяций она может не только объяснять настоящее, исходя из эволюционирующего прошлого, но также использовать нынешнее состояние популяций, чтобы восстановить их эволюцию. Действительно, мы можем реконструировать прошлое, исходя из актуальных данных о геномах, и оценить важные параметры эволюционного развития: темп роста популяции, возраст мутации или активность миграции между двумя популяциями.
История на три миллиарда: проект «Геном человека»
Генетические исследования начинают стремительно развиваться после 1977 года, когда появляются техники секвенирования, и в особенности благодаря проекту «Геном человека» – стартовавшей в конце 1988 года международной научной программе, задачей которой было определить полную последовательность ДНК генома человека. Первая версия генома, охватывающая 90 % последовательности, была получена в 2001 году, и вслед за ней в 2004 году опубликовали почти завершенную версию. Разница между первой – «черновой» – и окончательной версиями определяется покрытием секвенированной ДНК, другими словами, количеством несеквенированных участков, «пробелов», и степенью точности. Версия 2004 года содержит как минимум 400 пропусков. 99 % генома секвенировали с точностью менее одной ошибки на каждые 10 000 пар оснований. Эта работа сейчас продолжается, и референсная последовательность генома постоянно совершенствуется: в 2020 году количество пропусков становится уже менее 100.
Проект «Геном человека» ознаменовал собой начало новой эры[25] в генетике. Ученые получили возможность использовать последовательность ДНК для исследований как в медицинской, так и в популяционной генетике. Стоимость работ была астрономической; около 3 миллиардов долларов (2,7 миллиарда, если точнее) потратили, чтобы секвенировать около 3 миллиардов нуклеотидов (3,2 миллиарда, если точнее), которые составляют наш геном. В 2021 году, двадцать лет спустя после начала проекта, техники секвенирования стали такими совершенными, что теперь можно секвенировать целый геном, получив результаты с высоким уровнем точности, менее чем за 500 долларов. Как бы то ни было, секвенирование дает нам доступ к ключевым знаниям о структуре и содержании генома. На сегодняшний день мы знаем, что человеческий геном состоит из приблизительно 3,2 миллиарда нуклеотидов; что лишь 2 % генома являются «кодирующими», другими словами, содержат генетическую информацию, которая используется для синтеза белков – молекул, необходимых для возникновения живых существ. Мы знаем, что геном человека содержит примерно 20 000 генов, кодирующих белки; и что оставшаяся часть генома, то есть около 98 %, не является кодирующей и задействована по большей части в регуляции.
Последовательность нашего генома включает в себя так называемую ядерную ДНК, которая распределяется по 23 парам хромосом, находящимся в ядре каждой клетки. При этом у нас еще есть другой маленький геном, замкнутый в кольцо: митохондриальная ДНК. Она находится, как следует из ее названия, в митохондриях – крошечных органеллах клетки, отвечающих за производство необходимой для ее жизни энергии. По объему митохондриальная ДНК несопоставима с ядерной: в ней содержится всего 16 569 нуклеотидов и 37 генов – вот почему она стала первым геномом, который выбрали для секвенирования в 1981 году. Тем не менее далее мы увидим, что, несмотря на свой небольшой размер, митохондриальная ДНК открыла нам важнейшую информацию об эволюционном прошлом человека.
Геномика – наука, открывшая разнообразие: каждый индивид уникален
Для изучения необычайного разнообразия индивидов и популяций секвенирование генома человека на первых порах предоставило очень мало информации. По сути, речь шла об одной-единственной последовательности, а между тем каждый индивид, за исключением однояйцевых близнецов, обладает собственным уникальным геномом. И только с появлением в геномике новых технологий – таких как ДНК-микрочипы и секвенаторы нового поколения[26] – в сочетании со снижением расходов на секвенирование, начался золотой век в исследованиях разнообразия генома человека. Были созданы многочисленные международные консорциумы – как, например, проекты «ХэпМэп»[27] или «1000 геномов»[28], – перед которыми стояла задача изучить генетическое разнообразие человека во всей его полноте, содействуя таким образом исследованиям в области популяционной и медицинской генетики.
Благодаря этим исследованиям мы сегодня знаем, что существует несколько типов различий между геномами людей. Речь идет о масштабах мутаций – от одного-единственного нуклеотида до нескольких сотен тысяч – и их встречаемости. Самые распространенные и хорошо изученные мутации затрагивают единственный нуклеотид. Известный пример – однонуклеотидный полиморфизм, или SNP (произносится как «снип») – замещение в последовательности ДНК нуклеотида на другой (например, C меняется на T). Если мы возьмем геном любого из нас и сравним с референсной[29] последовательностью или сравним двух случайно выбранных индивидов в популяции, мы обнаружим в среднем от 3 до 4 миллионов «снипов». В подавляющем большинстве случаев эти изменения в геноме не влияют на его функции: они или находятся вне кодирующих участков гена – и тогда говорят о «молчащем» SNP, – или же обнаруживаются в экзонах гена (т. е. в участках, кодирующих белок), но при этом не приводят к замене кодируемой аминокислоты – и тогда говорят, что это синонимичный SNP. В большинстве случаев SNP нейтральны, они не влияют на приспособленность (fitness) индивидов. Нейтральные SNP очень полезны для изучения человеческих популяций, поскольку они позволяют проследить их историю – миграции, метисации, демографические изменения.
Тем не менее, в некоторых случаях SNP могут менять соответствующий белок и приводить к изменению фенотипа: неопасному – как, например, пигментация кожи, или вызывающему болезнь – например, муковисцидоз. Такие SNP делятся на несколько типов: миссенс-мутация (меняющие смысл, или несинонимические), когда SNP меняют аминокислотную последовательность соответствующего белка; нонсенс-мутация (бессмысленные) – когда кодон[30], обозначающий аминокислоту, заменяется стоп-кодоном, который производит неполный белок, в большинстве случаев не работающий. Если SNP не обнаружен в пределах кодирующего участка, это вовсе не означает, что он не влияет на функции гена. Действительно, мутации, находящиеся в регуляторных областях, – таких как энхансеры или промоторы (т. е. участки ДНК, отвечающие за управление экспрессией гена), могут модифицировать процесс экспрессии и в итоге изменять фенотип.
Но разнообразие, которое можно наблюдать при сравнении геномов различных индивидов, не ограничивается только SNP. Каждый из нас в равной степени отличается от референсной последовательности на приблизительно 450 000 коротких вставок или выпадений участков генома (иначе говоря, «инсерций» и «делеций», вместе называемых «инделы»), то есть участков ДНК, состоящих как минимум из 50 нуклеотидов, которые вставлены или удалены из последовательности ДНК. К этому добавляется особая форма генетической изменчивости, важность