Несса Кэри - Мусорная ДНК. Путешествие в темную материю генома
Глава 17. Почему «Лего» лучше, чем «Эйрфикс»
Многим детям (и немалому числу взрослых) нравится строить модели. Это можно делать самыми разными способами. Но давайте рассмотрим крайние варианты. Одним из самых популярных наборов-конструкторов в Великобритании стал в последние 30 с лишним лет «Эйрфикс» (Airfix). Маленькие пластмассовые детали самолетов, кораблей, танков и вообще почти всего, что вам может прийти в голову (как насчет бенгальских улан[66]?), предлагаются любителям моделирования вместе с подробными инструкциями. Моделист склеивает эти части, раскрашивает их, помещает на них переводные картинки и затем может наслаждаться законченным творением своих рук еще долгие годы.
Другая крайность — универсальная датская игрушка, которую я очень люблю. Речь идет, конечно же, о «Лего». Сейчас продается масса специализированных наборов «Лего», но основная идея в них всегда остается неизменной. Имеется сравнительно небольшое количество разновидностей компонентов, и эти детали можно соединять в любых сочетаниях по желанию пользователя. Построенную модель легко снова разобрать на исходные кирпичики, а затем использовать для создания чего-нибудь еще.
Примитивные организмы вроде бактерий тяготеют скорее к эйрфиксовскому пути. Их гены распределены четко и справедливо: каждый кодирует лишь один белок. Но чем сложнее становится организм, тем больше его геном начинает походить на «Лего»: значительно возрастает степень гибкости возможного использования компонентов. Когда мы задумываемся о том, какие же мы, люди, необыкновенные существа, можно даже воскликнуть, что на геномном уровне у нас «все потрясающе» (как сказано в известном фильме про «Лего»[67]).
Крайнее проявление этого феномена — сплайсинг, процесс, посредством которого наши клетки создают множество родственных друг другу белков на основе одного гена (см. рис. 2.5). Такое умение использовать компоненты гена множеством различных способов порождает невероятную биологическую гибкость и дарит организму дополнительные возможности. Мы получим некоторое представление о степени этой потенциальной вариативности обратившись к цифрам. Каждый ген человека содержит в среднем по 8 участков, кодирующих белки, и каждый из этих участков отделен от других областями мусорной ДНК[68]. Показано, что по меньшей мере 70% генов человека создают не менее чем по паре белков1. Это достигается благодаря объединению различных участков, кодирующих аминокислоты. В очередной раз воспользуемся нашим примером со словом БЛЕДНОСТЬ (см. все тот же рис. 2.5). Оно позволяет нам синтезировать не только белок, обозначаемый как ЛЕНОСТЬ, но и белок, обозначаемый как ДНО. Способность создавать разные белки таким путем называется альтернативным сплайсингом.
Участки, кодирующие аминокислоты, сравнительно коротки по сравнению с мусорными областями, которыми они перемежаются. Средняя длина нуклеотидных последовательностей, кодирующих аминокислоты, составляет около 140 пар нуклеотидных оснований, однако эти участки могут быть окружены мусорными областями длиной по несколько тысяч пар оснований2. Около 90% пар нуклеотидных оснований в гене принадлежат этим промежуточным последовательностям (назовем их так), а не участкам, кодирующим аминокислоты. Представив это как подобие текста на английском языке, мы сразу же увидим некоторые проблемы, с которыми сталкивается клетка.
Вообразите, что вы встретили юношу (или девушку), и он (она) вас совершенно очаровал (очаровала). И тут вы, узнав, что он (она) обожает поэзию, решили прямо-таки потрясти предмет вашего нового увлечения — прочесть стихи. Но, поскольку в школе вы всегда прогуливали уроки литературы, ваш приятель снабдил вас листком, на котором написана просто убийственная первая строчка стихотворения, способная сразить наповал. Но вдруг, в самый неподходящий момент, выясняется: почему-то ваш друг (возможно, страдающий легкой формой социопатии) спрятал слова этой строчки среди гигантского количества бессмысленных сочетаний букв. А у вас есть всего несколько секунд на то, чтобы отыскать запрятанные слова, произнести их вслух и покорить сердце вашего объекта обожания (или хотя бы привлечь его внимание). Ну как, удастся вам это сделать? Проверьте себя. Быстренько взгляните на рис. 17.1.
Где-то здесь спрятана замечательная поэтическая строка
Рис. 17.1. Бросьте всего один взгляд на этот устрашающий текст. Найдете в нем строчку, способную завоевать кое-чье сердце?
А ведь наши клетки проделывают это все время, постоянно, много раз в течение каждогодня нашей жизни. Клеточная аппаратура анализирует длинную цепочку явной абракадабры, почти мгновенно находит скрытые в ней слова и соединяет их вместе. Ладно уж, теперь можете посмотреть на рис. 17.2 и выяснить, удалось ли вам потягаться с неразумными белками, благодаря которым вы, между прочим, до сих пор живы.
Одна из самых романтичных и обольстительных первых строчек среди всех стихотворных текстов, когда-либо написанных по-английски: «Had we but world enough and time» (Когда бы времени хватило нам и мира)
(Эндрю Марвелл, «К стыдливой возлюбленной»)
Рис. 17.2. Читайте только то, что выделено жирным и подчеркнуто.
В любой длинной последовательности случайных букв всегда обнаружатся еще и комбинации, из которых, опять-таки, чисто случайно складываются слова. Если при ухаживании (интересно, в наши дни кто-нибудь еще ухаживает?) вы по ошибке произнесете именно эти слова, вы можете разрушить свой единственный шанс обрести счастье. Рисунок 17.3 покажет вам, как это может произойти.
При выборе определенной комбинации правильных и неправильных слов вы явно выразите совсем другое чувство: «Had we but had enough to drink» («Когда б хватило нам хмельного здесь напитка»).
Рис. 17.3. Нет! Комбинация неудачная!
Используя этот несколько причудливый пример, можно лучше понять некоторые чисто механистические проблемы, с которыми сталкиваются наши клетки, пытаясь должным образом провести сплайсинг молекул РНК. Если бы мы сами разрабатывали такой процесс, он бы, наверное, состоял из компонентов, показанных на рис. 17.43. Но компоненты, представленные на схеме, дают лишь упрощенную картину. Важно осознавать, что различные клетки будут по-разному обращаться с одним и тем же геном — в зависимости от типа клетки и от того, что происходит с ней в данный момент. А значит, все стадии процесса нужно соответствующим образом регулировать и интегрировать, чтобы вырабатывать именно такие вариации белков, которые лучше всего подходят к конкретной ситуации (то есть лучше всего удовлетворяют нуждам организма в данный момент).
Рис. 17.4. Сверху вниз: последовательность действий, которые должна уметь выполнять сплайсинговая аппаратура клетки, чтобы соединить все нужные участки, кодирующие аминокислоты, в зрелую РНК требуемого строения и состава.
Сплайсинг как образ жизни
Такой сплайсинг длинных РНК с целью создания более коротких информационных РНК, несущих в себе сведения об определенных белках, является по-настоящему комплексным процессом. Система эта очень древняя. Ее компоненты и стадии сохраняются практически неизменными на всем протяжении эволюции — от дрожжей до царства животных. Работу проводит гигантский конгломерат молекул, который называется сплайсосомой и который как раз и представляет собой аппаратуру для сплайсинга. Сплайсосома состоит из сотен белков, а также некоторых мусорных РНК. Чем-то это напоминает рибосомы, действующие как фабрики по производству белков4.
Одна из определяющих стадий процесса — обвивание сплайсосомы вокруг промежуточных последовательностей, которые требуется удалить из молекулы РНК. Сплайсосома вытесняет их и затем объединяет участки, кодирующие аминокислоты. Это чудовищно сложный многостадийный процесс. Мы знаем, что один из его первых ключевых этапов — распознавание промежуточных областей сплайсосомой. Ей ведь явно приходится начинать именно с этого, чтобы затем соединиться с ними и удалить их.
Начала и концы промежуточных последовательностей всегда отмечены определенными элементами из 2 нуклеотидных оснований. Молекулы мусорной РНК сплайсосомы могут соединяться с этими двухосновными последовательностями. Во многом это похоже на то, как две нити ДНК соединяются в наших генах с помощью пар таких же нуклеотидных оснований.
Однако в РНК (как и в ДНК) лишь 4 разных нуклеотидных основания, а значит, возможно лишь 16 комбинаций из двух оснований (АЦ и ЦА, как и все подобные симметричные сочетания, считаются разными парами). Следовало бы ожидать, что двухосновные элементы, обозначающие начала и концы промежуточных областей, будут представлены и в других местах этих областей, а также в участках, кодирующих аминокислоты. Так и есть. Поэтому, хотя эти двухосновные последовательности необходимы для сплайсинга, их наличия еще недостаточно для того, чтобы направлять процесс должным образом. Требуются и другие последовательности (см. рис. 17.5).