Именно СПП, во всяком случае значительную часть их, обвиняют в эгоизме.
3) Наконец, уникальные последовательности (УП). Судя по названию, они представлены в геноме (гаплоидном) только один раз, во всяком случае, не более десяти. Большинство структурных генов, кодирующих белки, относятся к этому классу. Но хотя доля их во фракции очень мала, УП в геномах высших организмов в 10–100 раз больше, чем нужно для того, чтобы записать информацию о всевозможных белках. Что же делают остальные УП?
Часть их удается «пристроить» в качестве так называемых спейсеров-разделителей, разобщающих структурные гены. Но спейсерами бывают и СПП. «Эгоистичными» их тоже назвать нельзя: согласно этой теории гены-эгоисты защищаются от вырезания из хромосом и сохраняют свой состав. К большей части УП обычно применяют термины «мусорная» и «мертвая», иногда «умирающая» ДНК.
Все это далеко не так просто, и вот почему. У ядерных организмов и архебактерий структурные гены имеют сложное строение. Куски ДНК, кодирующие аминокислотные последовательности (экзоны), перемежаются последовательностями, не кодирующими ничего (интронами). При созревании информационной РНК интроны вырезаются специальными ферментами и отбрасываются, а экзоны сшиваются другим ферментом – лигазой в зрелую РНК, на которой может транслироваться белок. Интроны дружно объявили ненужными частями гена – ведь белка они не кодируют! Но этому мешает одно неприятное обстоятельство.
В УП часто встречаются точные копии структурных генов разных белков, но они не содержат интронов. Как они возникают, в общем, неясно. Скорее всего, это ДНК-копии информационных РНК, встроившиеся обратно в геном. Так делают ретро-вирусы, в том числе знаменитый СПИД. Но РНК ретровирусов содержит интроны и, включаясь в геном в виде ДНК, остается активной.
А безинтронные копии генов неактивны. На них не идет синтез РНК, белков они не вырабатывают. Потому их назвали лжегенами – псевдогенами. Что же, получается, что ген теряет активность, если из него вырезать ненужные части?
Но, может быть, в категорию «мусорной» и «мертвой» ДНК следует отнести псевдогены? Так, в общем, считает большинство теоретиков. Экспериментаторы не столь единодушны. Есть факты, которые никак не запихнуть в мешок модной гипотезы.
Возьмем хотя бы ген глобина «дельта». Этот ген активен у низших обезьян Нового Света (широконосых). У более высокоразвитых узконосых обезьян Старого Света, таких как мартышки, макаки, павианы, нет гемоглобина «дельта» – но ген, кодирующий эту форму белка, есть. Однако у него нет интронов, он неактивен и попадает в категорию псевдогенов. Казалось бы, ясно: ген «умер», попал в разряд «мусорных». Однако у человека он обретает интроны и вновь становится активным. Так что же такое псевдогены – свалка мусора или запас на будущее, так сказать «гены в творческом отпуске»?
Есть и более странные факты. Один и тот же ген в мозговой ткани активен и нарабатывает белок. А в почках он же представлен безинтронным псевдогеном.
Полагаю, что нужно воздержаться от преждевременных суждений и бранных эпитетов, пока мы не разберемся до конца в этой сложной ситуации. Думаю, что, пока выйдет в свет эта книга, многое уже будет ясно.
А пока посмотрим, не поможет ли нам, хотя бы в построении гипотез, аналогия с лингвистическими текстами.
Монморенси – последовательность уникальная. Еще 10 лет назад в статьях по структуре генома были модными графики, по которым можно было определить распределение нуклеотидных последовательностей по скорости отжига, реассоциации. На оси абсцисс (ось Х) у них обычно откладывалась не скорость реассоциации, а величина c0t – произведение начальной концентрации денатурированной ДНК на время отжига. А так как эта величина в одном геноме изменяется на пять порядков, давали ее логарифм.
Читается c0t как «це-ноль-тэ», но на лабораторном жаргоне говорили – «кот» («мы отожгли ДНК до ста котов»). Жаргонное словцо хорошо свидетельствует о популярности метода. В самом деле, при равных объемах геномов c0t связано с копийностью (числом повторов) прямой зависимостью.
На оси ординат (ось Y) откладывали процент данной фракции в геноме, только шкала была перевернута.
Эти так называемые кривые кинетики реассоциации сыграли свою роль, да и сейчас часто используются. Вспомнил я о них вот по какой причине. Любой человеческий язык несколько условно можно трактовать как состоящий из двух категорий слов (или частей слов). Первая категория состоит из слов, за которыми стоят какие-то объективные реалии. Это корни существительных, прилагательных и глаголов.
Вторая категория – флексии, предлоги, приставки, артикли, окончания – то, что придает смысл корням, но без них самих смысла не имеет. С другой стороны, один корень без соответствующих «добавок» становится невразумительным. Например, что значит английское слово strike? Не спешите с ответом. The strike – забастовка (существительное). A to strike – бастовать (глагол). Отдельно же взятый артикль ни о чем не говорит, как и частица to.
А если в генетических текстах структурные гены выполняют функцию корней слов первой категории (ведь за ними стоят реалии – аминокислотные тексты белков), а повторы и некодирующие белков УП играют роль слов второй категории? Тогда станет ясно, что они столь же необходимы в ДНК-тексте, как и структурные гены. Попробуйте в разговоре и письме обойтись одними корнями.
Эгоистичность повторов иногда доказывают таким доводом: у вида А такой повтор есть, а у вида Б нет. Значит, он не нужен.
Аналогичное рассуждение: в немецком языке есть артикли, характеризующие род существительного. Родственные артикли в английском превратились в детерминативы существительных (категория рода в английском языке отмирает). А в русском языке артиклей нет вообще, они не нужны. Значит ли это, что они не нужны и в немецком, английском и французском языках?
Вопрос мой явно риторический. Приведу пример из мемуаров французского подводника Ж. Уо. Погружаясь в батискафе с директором биостанции Вильфранш Трегубовым, русским по происхождению, Уо сокрушенно называет его блестящим собеседником, по непонятной причине опускавшим решительно все артикли. Сорок лет прожив во Франции, он так и не привык к ним – по той причине, что в русском языке их заменяют другие вспомогательные слова.
Такие соображения привели меня лет десять назад к идее одного эксперимента (если его можно так назвать). Я взял английский текст (первую главу из общеизвестной книги Д. К. Джерома «Трое в одной лодке…») и на досуге выписал из нее все слова, определив частоту их встречаемости. А затем построил график, аналогичный кривой кинетики реассоциации ДНК – только вместо c0t взял частоту встречаемости слов в тексте.
Получилась довольно наглядная кривая, которую коллеги принимали именно за этот образец. Четко выделились высокоповторяющиеся последовательности (the, a, an, to), средние повторы (in, on, into, – ing). И, наконец, уникальные. Туда же попал и Монморенси – ведь кличка знаменитого фокстерьера встречается в первой главе только один раз.
Почему я взял англоязычный текст? С ним легче работать, легче отстраниться. Сейчас я думаю, что русскоязычный дал бы еще более четкую картину – за счет флексий. Человек, владеющий персональным компьютером, был бы способен на анализ более протяженных и сложных текстов, и аналогия выступила бы еще нагляднее.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
3) Наконец, уникальные последовательности (УП). Судя по названию, они представлены в геноме (гаплоидном) только один раз, во всяком случае, не более десяти. Большинство структурных генов, кодирующих белки, относятся к этому классу. Но хотя доля их во фракции очень мала, УП в геномах высших организмов в 10–100 раз больше, чем нужно для того, чтобы записать информацию о всевозможных белках. Что же делают остальные УП?
Часть их удается «пристроить» в качестве так называемых спейсеров-разделителей, разобщающих структурные гены. Но спейсерами бывают и СПП. «Эгоистичными» их тоже назвать нельзя: согласно этой теории гены-эгоисты защищаются от вырезания из хромосом и сохраняют свой состав. К большей части УП обычно применяют термины «мусорная» и «мертвая», иногда «умирающая» ДНК.
Все это далеко не так просто, и вот почему. У ядерных организмов и архебактерий структурные гены имеют сложное строение. Куски ДНК, кодирующие аминокислотные последовательности (экзоны), перемежаются последовательностями, не кодирующими ничего (интронами). При созревании информационной РНК интроны вырезаются специальными ферментами и отбрасываются, а экзоны сшиваются другим ферментом – лигазой в зрелую РНК, на которой может транслироваться белок. Интроны дружно объявили ненужными частями гена – ведь белка они не кодируют! Но этому мешает одно неприятное обстоятельство.
В УП часто встречаются точные копии структурных генов разных белков, но они не содержат интронов. Как они возникают, в общем, неясно. Скорее всего, это ДНК-копии информационных РНК, встроившиеся обратно в геном. Так делают ретро-вирусы, в том числе знаменитый СПИД. Но РНК ретровирусов содержит интроны и, включаясь в геном в виде ДНК, остается активной.
А безинтронные копии генов неактивны. На них не идет синтез РНК, белков они не вырабатывают. Потому их назвали лжегенами – псевдогенами. Что же, получается, что ген теряет активность, если из него вырезать ненужные части?
Но, может быть, в категорию «мусорной» и «мертвой» ДНК следует отнести псевдогены? Так, в общем, считает большинство теоретиков. Экспериментаторы не столь единодушны. Есть факты, которые никак не запихнуть в мешок модной гипотезы.
Возьмем хотя бы ген глобина «дельта». Этот ген активен у низших обезьян Нового Света (широконосых). У более высокоразвитых узконосых обезьян Старого Света, таких как мартышки, макаки, павианы, нет гемоглобина «дельта» – но ген, кодирующий эту форму белка, есть. Однако у него нет интронов, он неактивен и попадает в категорию псевдогенов. Казалось бы, ясно: ген «умер», попал в разряд «мусорных». Однако у человека он обретает интроны и вновь становится активным. Так что же такое псевдогены – свалка мусора или запас на будущее, так сказать «гены в творческом отпуске»?
Есть и более странные факты. Один и тот же ген в мозговой ткани активен и нарабатывает белок. А в почках он же представлен безинтронным псевдогеном.
Полагаю, что нужно воздержаться от преждевременных суждений и бранных эпитетов, пока мы не разберемся до конца в этой сложной ситуации. Думаю, что, пока выйдет в свет эта книга, многое уже будет ясно.
А пока посмотрим, не поможет ли нам, хотя бы в построении гипотез, аналогия с лингвистическими текстами.
Монморенси – последовательность уникальная. Еще 10 лет назад в статьях по структуре генома были модными графики, по которым можно было определить распределение нуклеотидных последовательностей по скорости отжига, реассоциации. На оси абсцисс (ось Х) у них обычно откладывалась не скорость реассоциации, а величина c0t – произведение начальной концентрации денатурированной ДНК на время отжига. А так как эта величина в одном геноме изменяется на пять порядков, давали ее логарифм.
Читается c0t как «це-ноль-тэ», но на лабораторном жаргоне говорили – «кот» («мы отожгли ДНК до ста котов»). Жаргонное словцо хорошо свидетельствует о популярности метода. В самом деле, при равных объемах геномов c0t связано с копийностью (числом повторов) прямой зависимостью.
На оси ординат (ось Y) откладывали процент данной фракции в геноме, только шкала была перевернута.
Эти так называемые кривые кинетики реассоциации сыграли свою роль, да и сейчас часто используются. Вспомнил я о них вот по какой причине. Любой человеческий язык несколько условно можно трактовать как состоящий из двух категорий слов (или частей слов). Первая категория состоит из слов, за которыми стоят какие-то объективные реалии. Это корни существительных, прилагательных и глаголов.
Вторая категория – флексии, предлоги, приставки, артикли, окончания – то, что придает смысл корням, но без них самих смысла не имеет. С другой стороны, один корень без соответствующих «добавок» становится невразумительным. Например, что значит английское слово strike? Не спешите с ответом. The strike – забастовка (существительное). A to strike – бастовать (глагол). Отдельно же взятый артикль ни о чем не говорит, как и частица to.
А если в генетических текстах структурные гены выполняют функцию корней слов первой категории (ведь за ними стоят реалии – аминокислотные тексты белков), а повторы и некодирующие белков УП играют роль слов второй категории? Тогда станет ясно, что они столь же необходимы в ДНК-тексте, как и структурные гены. Попробуйте в разговоре и письме обойтись одними корнями.
Эгоистичность повторов иногда доказывают таким доводом: у вида А такой повтор есть, а у вида Б нет. Значит, он не нужен.
Аналогичное рассуждение: в немецком языке есть артикли, характеризующие род существительного. Родственные артикли в английском превратились в детерминативы существительных (категория рода в английском языке отмирает). А в русском языке артиклей нет вообще, они не нужны. Значит ли это, что они не нужны и в немецком, английском и французском языках?
Вопрос мой явно риторический. Приведу пример из мемуаров французского подводника Ж. Уо. Погружаясь в батискафе с директором биостанции Вильфранш Трегубовым, русским по происхождению, Уо сокрушенно называет его блестящим собеседником, по непонятной причине опускавшим решительно все артикли. Сорок лет прожив во Франции, он так и не привык к ним – по той причине, что в русском языке их заменяют другие вспомогательные слова.
Такие соображения привели меня лет десять назад к идее одного эксперимента (если его можно так назвать). Я взял английский текст (первую главу из общеизвестной книги Д. К. Джерома «Трое в одной лодке…») и на досуге выписал из нее все слова, определив частоту их встречаемости. А затем построил график, аналогичный кривой кинетики реассоциации ДНК – только вместо c0t взял частоту встречаемости слов в тексте.
Получилась довольно наглядная кривая, которую коллеги принимали именно за этот образец. Четко выделились высокоповторяющиеся последовательности (the, a, an, to), средние повторы (in, on, into, – ing). И, наконец, уникальные. Туда же попал и Монморенси – ведь кличка знаменитого фокстерьера встречается в первой главе только один раз.
Почему я взял англоязычный текст? С ним легче работать, легче отстраниться. Сейчас я думаю, что русскоязычный дал бы еще более четкую картину – за счет флексий. Человек, владеющий персональным компьютером, был бы способен на анализ более протяженных и сложных текстов, и аналогия выступила бы еще нагляднее.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20