Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 29

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 23 24 25 26 27 28 < 29 > 30 31 32 33 34 35 .. 119 >> Следующая

было показано, что если пренебречь самопересечениями слов, то этот вывод остается верен для марковских моделей порождения генетического текста). Таким образом, увеличение б по сравнению с М|/2 свидетельствует о неравномерности распределения слова в тексте. В качестве меры нестационарности слова W можно ввести отношение к=б/Е1/2: для слова, относительно равномерно распределенного по тексту, к невелико (такие слова, т.е. слова с k<krp , где кгр - пороговое отклонение, мы будем называть стационарными), в противном случае слово называется нестационарным ( k>krp ).
В табл. 2.7 представлены значения коэффициента неоднородности к для двухбуквенных слов в исследовавшихся нами генетических текстах (длина окна равна 1000). Если задать некоторый уровень значимости (например, кгр=2), то окажется, что во всех случаях нестационарные слова - polyW- и polyS-тракты (единственное исключение - слово TG в геноме вируса Эпштейна-Барр,для которого к=2,3).
Таблица 2.7 Значения коэффициента неоднородности к для двухбуквенных слов
1 Т-г Т7 AD2 EBV 1RPLRPOIE.COLI
!LAMBDAI
АА 3,1* 1,4* 3, и* 2, 8* 1,4* 1,6*
АТ 2,3* 1,1 2,3* 2,9* 0,7 1,3
AG 1,2 0,9 1,2 1,7 1,1 1,5
АС 1.1 1,0 2,0 2,0 1,1 1,1
ТА 2,9* 1,2* 2,4* 2, 8* 0,8 1,3
ТТ 2,9* 1,3* 2,9* 2,8* 2,0* 2,5*
TG 1,4 1,0 1,7 2,3 1,0 1,3
ТС 1,0 0,9 2,0 1,7 1,1 1,3
GA 1,3 1,0 1,6 1,9 .0,9 1,3
GT 1,8 1,1 1,9 1,9 1,1 1,3
GG 2,7* 1,2* 2,7* 2,6* 1,2* 1,6*
GC 2,6* 1,6* 2,6* 1,9 1,1 1,5*
СА 1,3 1,2 1,9 1,7 0,7 1,5
СТ 1,0 1,0 1,3 1,6 1,2 1,3
CG 2,8* 1,1 3,5* 2,5* 1,4* 1,4
СС 1,9* 1,2* 2,0* 3,5* 1,2* 1,5*
к,Р 1,87 1,17 2ЛТ2- 2, Ь4 1,'23 1, bb
В табл.2.7 звездочками отмечены значения k>krp, при этом все отмеченные 2-граммы являются polyS- или polyW-трактами (значения кгр выбраны произвольно, длина окна равна 1000).
На рис.2.6 приведены графики коэффициентов неоднородности динуклеотидов (динуклеотиды расположены в порядке убывания коэффициента неоднородности), а на рис.2.7 - тринуклеотидов. polyW- и polyS-трак-там (выделены кружочками) соответствуют большие значения коэффициентов неоднородности при этом видно, что геном фага Т7 и выборка E.coli - однородные генетические тексты (единственный нестационарный
Р и с.2.6. Графики коэффициентов неоднородности для динуклеотидов в различных генетических текстах
Значения коэффициента неоднородности для динуклеотидов k(i),i=l,16 упорядочены по убыванию и представлены на графике для фага лямбда, аденовируса, вируса Эпштейна-Барр, фага Т7, выборки генов E.Coli. Значения к, соответствующие динуклеотидам АА,АТ, ТА,ТТ, GG,GC,CG,CC (polyS- и polyW-тракты) , представлены кружочками. Во всех случаях кружочки сосредоточены в левой части графиков (большие значения коэффициента неоднородности), т.е. polyS- и polyT-тракты - нестационарные слова в рассматриваемых генетических текстах
Р и с.2.7. Графики коэффициентов неоднородности для тринуклеотидов в различных генетических текстах
Значения коэффициента неоднородности для тринуклеотидов k(i),i=l,64 упорядочены по убыванию и представлены на графике для фага лямбда, аденовируса и вируса Эпштейна-Барр. Значения к,соответствующие тринуклеотидам AAA, ААТ, АТА, ATT, ТАА, TAT, ТТА, ТТТ, GGG, GGC, GCG, GCC, CGG, CGC, CCG, ССС (polyS-и polyW-тракты),выделены маркерами. Видно, что во всех случаях маркеры сосредоточены в левой части графиков (большие значения коэффициента неоднородности),т.е. polyS- и ро1уТ-тракты - нестационарные слова в рассматриваемых генетических текстах
динуклеотид в этих текстах - ТТ в выборке E.coli) в то время как геном фага лямбда, аденовируса и вируса Эпштейна-Барр состоят из блоков различной статистической природы (однородность фага Т7 по нуклеотидному составу была обнаружена довольно давно при помощи физикохимических методов (Дэвидсон, Сцибальский,1975). Недавно Блейк и Ерли (Blake,Ear ley,1986) провели компьютерный анализ нуклеотидных последовательностей из E.coli и обнаружили высокую однородность по динуклеотидному составу). Учет информации о нестационарных polyW- и polyS-трактах позволяет подойти к вопросу о зонной структуре ДНК и предложить метод разбиения ДНК на зоны (следует отметить, что аномалии в распределении polyW- и polyS-трактов в эукариотических ДНК изучались в работах Блейсдела (Blaisdell,1983а,Ь)).
Зонная структура генома фага лямбда. Еще в ?0-х годах (До-ув,19?5) была предложена гипотеза о модульной структуре геномов бактериофагов (в дальнейшем она была значительно развита Кемпбеллом и Ботштейном(СашрЬе11,1977; Campbell,Botstein,1983)), при этом модуль понимается как "дифференцированный сегмент, детерминирующий опреде-
ленные функции". Можно считать, что модуль - это последовательность генов, способная к осуществлению определенной функции и обладающая способностью к соединению с другими модулями при построении структур более высокой иерархии - плазмид, фагов и т.д. Позднее Крылов (1985) распространил понятие модуля и на субгенный уровень (см. также Dhillon et al.,1982).
Предыдущая << 1 .. 23 24 25 26 27 28 < 29 > 30 31 32 33 34 35 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed