Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 30

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 119 >> Следующая

Анализ генома фага лямбда свидетельствует, что гены, обладающие определенными функциями, расположены в нем не случайно, а сгруппированы в блоки - группирование генов может иметь эволюционный смысл, предотвращая разделение в ходе рекомбинации функционально связанных генов и специфических регуляторных сайтов. Один из основных выводов модульной гипотезы: наличие в природных популяциях фагов, возникших как следствие почти свободного обмена отдельными модулями. Проверка этого вывода для лямбдоидных фагов проводилась в серии работ (Крылов, Цыганков,1976; Крылов и др., 1977; Krylov,1981). Сускинд и Ботш-тейн (Susskind,Botstein,1978) предположили, что негомологичные смежные модули должны быть ограничены по краям последовательностями нуклеотидов, допускающими рекомбинацию, ведущую к обмену модулями.
В работе Певзнера и др. (Pevzner et al.,1989b) была предпринята попытка компьютерного анализа зонной структуры генома фага лямбда и интерпретации ее в рамках модульной гипотезы. При этом предполагалось, что модули, имеющие разное происхождение, должны быть по-разному устроены статистически. Конечно, эти статистические различия могут оказаться довольно тонкими и не выявляться на уровне примитивного сравнения A,T,G,C составов - ведь все модули одного генома испытывали уже в составе этого генома продолжительное эволюционное давление, которое могло привести к сглаживанию исходных различий. Поэтому при статистическом анализе использовалось различие частот встречаемости стационарных 1-грамм, которые были введены в предыдущем разделе.
Ранее было показано, что генетические тексты не всегда можно адекватно описать моделью однородной марковской цепи - возникает необходимость выявления блочной структуры ДНК, т.е. разбиения ДНК на некоторые блоки, удовлетворяющие условию: при переходе границы между блоками статистические характеристики генетического текста меняются. При определении блочной структуры ДНК (Pevzner et al,1989b) использовались стационарные и нестационарные слова в генетических текстах. Дело в том, что при определении границ между предполагаемыми блоками необходимо определять разность 1-граммного состава между окном слева от точки границы и справа от нее. Таким образом, позиция 1 рассматривается как потенциальная граница блоков, если разность 1- граммных составов в окне слева (i-l,i-d) и справа от нее (i+l,i+d) велика.
Для определения разности 1-граммных составов, например при 1=2, можно положить
г = 1/16 ё d2, i=l i
при этом в сумме будут учитываться все 1-граммы, как стационарные,
1 г 1 г
так и нестационарные ( здесь d =h -h , где h (h ) - количество
i i i i i
2-грамм i-го вида в левом(правом) окне). Поскольку распределение
нестационарных 1-грамм в тексте крайне неравномерно, учет их в формуле (2.14) приведет к высокому уровню "шума" и появлению случайных границ блоков. Более адекватным является подход, когда суммирование в (2.14) идет не по всем, а лишь по стационарным 1- граммам, распределение которых в тексте испытывает случайные Флуктуации в значительно меньшей степени, чем распределение нестационарных 1-грамм. Таким образом, формула (2.14) переписывается в виде
ТЧ 2
г = 1/|S| S d , (2.15)
ieS i
где S - множество стационарных 1-грамм (выше было показано, что з качестве S для 2-грамм можно рассматривать 8 динуклеотидов
AG,AC,TG,TC,GA,GT,CA,CT в качестве 3-грамм - 48 тринуклеотидов и т.д.).
По критерию (2.15) была построена функция г (г вычислялось для
каждой позиции ДНК) фага лямбда(рис.2.8), при этом положение пиков
на графике соответствует предполагаемым границам между модулями. Сопоставим эти графики и современные представления о модульной структуре ДНК фага лямбда. На рис.2.8 функция г для фага лямбда сопоставлена с его генетической картой (Sanger et al.,1982). Можно выделить семь пиков функции г (длина окна равна 1000, конкретные значения г при изменении длины окна могут меняться,однако общая форма и положение пиков сохраняются), при этом положение пиков 3-7 соответствует следующим элементам функциональной организации фага лямбда.
1. Пик 3 - отделяет правый конец области структурных генов от лево-
го конца Ь-области (правая транскрипция). Функции генов b-области неизвестны.
2. Пик 4 - точка окончания основных правого и левого оперонов (в
работе (Sanger et al.,1982) точка 22 500 обозначена как точка изменения направления транскрипции - в области пика
4 сталкиваются правая транскрипция с промотора pR и левая транскрипция с промотора pL).
3. Пик 5 - отделяет b-область (левая транскрипция) от модуля генов
сайт-специфической рекомбинации, ответственного за интеграцию и исключение фага.
Предыдущая << 1 .. 24 25 26 27 28 29 < 30 > 31 32 33 34 35 36 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed