Вячеслав Тарантул - Геном человека: Энциклопедия, написанная четырьмя буквами
Как уже было показано в ранних экспериментах, описанных выше, в ДНК человека содержатся многочисленные элементы, которые не кодируют никакие белки, но при этом многократно встречаются в ДНКовом тексте. В «догеномную» эру считалось, что такие повторы составляют около 25% генома человека. Секвенирование ДНК показало, что их существенно больше: повторяющиеся последовательности в сумме занимают около 50% ДНКового текста. А общее число таких повторов в геноме человека равно приблизительно 5 миллионам. Для сравнения: у дрозофилы доля повторов в геноме составляет менее 5%, у червя — 6–7%, а у других млекопитающих — чуть меньше, чем у человека. Повторы напоминают бессмысленные фразы, которые с упорным постоянством в разных вариациях повторяются в тексте, но от этого смысл в них все равно не возникает.
На рис. 25 приведены некоторые основные варианты расположения повторов в геноме человека, а далее мы подробнее остановимся на описании отдельных из них.
Рис. 25. Основные варианты расположения повторяющихся последовательностей в геноме человека. Повторы обозначены стрелками, неповторяющиеся участки — серыми линиями
Перевёртыши (обращенные повторы)
В ДНКовых текстах человека, как, впрочем, и в ДНК других организмов, присутствуют уже упоминавшиеся обращенные повторы, перевертыши или, как их еще часто называют, палиндромы. Уже говорилось о том, что перевертыши-палиндромы хорошо известны из литературы — это предложения, которые читаются одинаково слева направо и справа налево без учета знаков препинания и интервалов между словами. Считается, что палиндромы известны еще со времен Древней Греции, т. е. свыше двух тысяч лет. На Руси палиндромы когда-то назывались «рачьими стихами». В качестве примера приведем две державинские строки:
Я разуму уму заря,Я иду с мечем судия.
Особое свойство таких участков ДНК заключается в том, что при определенных состояниях ДНК они способны образовывать структуры, называемые крестами. На рис. 26 дан пример одного из таких возможных крестов.
Рис. 26. Крест, способный образовываться последовательностью ДНК, состоящей из обращенных повторов
В реальной ситуации в клетке такие структуры действительно могут формироваться. Но зачем это нужно? Окончательного ответа на этот вопрос нет. Одно из предположений сводится к тому, что кресты могут быть местами связывания с какими-то специфическими белками, обеспечивающими регуляцию или процессов транскрипции, или репликации ДНК. С другой стороны, при транскрипции таких структур в РНК должны формироваться «шпильки», а такие структуры в РНК часто являются значимыми (то есть выполняют определенные функции — или способствуют транскрипции, или, наоборот, препятствуют ей).
Простые тандемные повторы (сателлиты)
Как и у других организмов, в геноме человека присутствуют короткие повторяющиеся нуклеотидные последовательности, которые расположены вплотную друг за другом (тандемно). Их часто называют сателлитными ДНК. Мы уже говорили о сателлитных ДНК ранее. Это те участки ДНК, которые при центрифугировании в градиенте солей цезия осаждаются отдельно вне области основной массы ДНК. В разных типах сателлитной ДНК различные копии представлены неодинаково — их численность варьируется от сотен до миллионов. Если записать их структуру текстом, то это выглядит, как, например, предложение из одного и того же слова: столстолстолстолстолстолстолстолстол. Ясно, что такие предложения не могут кодировать никакую серьезную информацию. Тем не менее выяснилось, что с сателлитными нуклеотидными последовательностями в некоторых случаях могут специфически взаимодействовать отдельные белки. А это уже некоторое довольно серьезное указание на возможное участие таких повторов в каких-то клеточных процессах.
К настоящему времени в геноме человека обнаружено по крайней мере шесть видов сателлитных повторов. Это в первую очередь три типа так называемых классических сателлитов. Сателлит 1 состоит из элементарной повторяющейся последовательности нуклеотидов длиной 42 п. н. (располагается на семи разных хромосомах); сателлиты 2 и 3 состоят из элементарных повторяющихся единиц длиной 5 п. н. (первый из них обнаружен на четырех, а второй — на двенадцати разных хромосомах).
Кроме того, во всех хромосомах человека присутствуют альфа-сателлитные повторы. Они имеют элементарную повторяющуюся нуклеотидную последовательность длиной 171 п. н. Существуют еще бета-сателлитные повторы с элементарной повторяющейся единицей длиной 68 п. н., которые встречаются лишь на девяти хромосомах. Еще реже представлены в геноме человека гамма-сателлитные повторы, имеющие элементарную повторяющуюся единицу длиной 220 п. н. Такие повторы присутствуют только на двух хромосомах человека (8 и X).
Распределение всех сателлитных ДНК вдоль хромосом не выглядит случайным. Так, некоторые из них «гнездятся» в районах, прилежащих к концам хромосом, и в области центромеры (перетяжка на хромосомах, которая не всегда расположена в самом центре, см. рис. 7). В частности, центромеры всех хромосом человека, размер которых варьирует от 0,1 до 4 млн. п.н., состоят преимущественно из альфа-сателлитных ДНК.
Наряду с типичными сателлитными ДНК, в геноме человека имеются нуклеотидные последовательности, получившие название мини- и микросателлитов, которые разбросаны по большинству участков всех хромосом и в сумме составляют около 3% генома человека. В среднем один из таких сателлитов содержится в каждых 2 тыс. п. н. человеческого генома. Минисателлиты представляют собой повторяющиеся нуклеотидные последовательности размером от 11 до 500 п. н. Кластеры таких повторов занимают от 0,1 до 20 тысяч п. н. в человеческом геноме, а общее число таких районов во всех хромосомах человека составляет несколько тысяч. Еще меньше по размерам микросателлиты. Их повторяющаяся нуклеотидная последовательность состоит из 10 и меньше п. н. Микросателлиты занимают в геноме человека обычно небольшие участки (до 150 п. н.). Когда же в тексте повторяется всего одна «буква» из четырех, такие структуры называют гомополимерными нуклеотидными последовательностями. Примером гомополимерной последовательности нуклеотидов в геноме человека может служить последовательность ААААААААААААААААААААААА на одной нити и, соответственно, ТТТТТТТТТТТТТТТТТТТТТТТ на другой.
Микросателлиты, состоящие из двух пар нуклеотидов (динуклеотидные повторы), занимают около 0,5% генома человека. Наиболее частыми динуклеотидами являются АЦ и АТ (50 и 35% всех динуклеотидов, соответственно). А вот динуклеотидный повтор, состоящий из пары ГЦ, в ДНКовом тексте человека занимает всего лишь 0,1%. Наиболее частые из более «сложных» микросателлитов (тринуклеотидных повторов) являются ААТ (33% от всех тринуклеотидных повторов) и ААЦ (21%). Триплет ЦГГ, который довольно редок в геноме, присутствует в гене FMR–1, определяющем синдром ломкости X-хромосомы. У нормальных людей число копий ЦГГ в гене варьирует от 6 до 54. А вот у больных индивидуумов такие триплеты «размножаются» и их число в гене может достигать 200–1300 копий. Подробнее о связи между сателлитными повторами и различными заболеваниями человека мы еще поговорим далее. Но остается загадкой: зачем такие нуклеотидные последовательности вообще нужны геному.
Выше приведенный пример и множество других случаев указывают на то, что микро- и минисателлиты весьма изменчивы, т. е., как говорят, полиморфны. Их распределение и число в геноме каждого конкретного человека столь специфично, что может использоваться в качестве аналога отпечатков пальцев. Как только это было обнаружено, этим фактом сразу воспользовались. В настоящее время ненужная вроде бы фракция генома человека (а на самом деле возможно и нужная, но мы просто о ней мало что знаем) стала востребована человеком для своих практических целей. На основании вариабельности сателлитных ДНК была развита диагностика родственных связей между людьми, склонности человека к различным заболеваниям и др. (см. об этом подробнее далее в разделе о геномной дактилоскопии).
И, наконец, еще один вид сателлитной ДНК был обнаружен при секвенировании генома человека, который получил название мегасателлитов. Эти тандемные повторы имеют размер от 2,5 до 5 тыс. п. н. и повторяются от 50 до 400 раз. Мегасателлиты присутствуют лишь в небольшом числе хромосом (в 4, 8, 19 и X).
Диспергированные повторы
В ДНКовом тексте генома человека содержится множество более длинных повторяющихся нуклеотидных последовательностей, которые в отличие от сателлитных повторов рассеяны (диспергированы) по всему геному. Эти повторы называют вездесущими, так как они присутствуют во всех районах всех хромосом, а иногда обнаруживаются даже и внутри генов. В сумме около половины ДНКового текста генома человека представлено такими повторами.