Научная литература
booksshare.net -> Добавить материал -> Биология -> Соловьев В.В. -> "Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов" -> 23

Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов - Соловьев В.В.

Соловьев В.В. Использование ЭВМ в молекулярной биологии. Введение в теорию генетических текстов — Новосибирск, 1988. — 93 c.
Скачать (прямая ссылка): ispolzovanieevmvmolekulyarnoy1988.djvu
Предыдущая << 1 .. 17 18 19 20 21 22 < 23 > 24 25 26 27 28 29 .. 30 >> Следующая

Пример консенсуса для энхансерных участков приведен на рис. 37,6 /166/.
71
Таблица 5
Номенклатура однобуквенного обозначения определенных групп, нуклеотидов./168/
Символ Значение Источник обозначения
А А Аденин
Т Т Тимин
& G Гуанин
С С Цитозин
R G или А Пурин PU R INE
Y Т или С Пиримидин 7 Y К1М1Л1Ж
М А или С Амино А М IN0
К G или Т Кето К Е TONE
S G или С Сильные взаимодействия (3 Н-связи)
W А или Т Слабые взаимодействия (2 Н-связи)
Н А или С или Т Не б , Н следует за 6 в алфавите
в 0 или Т или С Не А, В следует за А в алфавите
V G или С или А Не Т,V следует за Т в
3 алфавите
Gили А или Т Не С,Л) следует за С в алфавите
н G или А или Т или С Любой нуклеотид AMY
Консенсус является качественной характеристикой ФС, так как описывает их самые общие структурные особенности.
Количественной характеристикой ФС является двумерная весовая матрица W ( {, к) (рис. 37,в). В ней по горизонтали откладываются позиции в наборе выравненных последовательностей, по вертикали расположены буквы алфавита генетического текста (например, для ДНК - А, Т, G, С ): к - число букв в алфавите; / - длина исследуемого ФС. Элемент матрицы W(i,j)
72
представляет собой частоту встречаемости нуклеотида ь в j-й позиции набора гомологичных ФС либо число нуклеотидов i в j -й позиции или аналогичные характеристики.
Как консенсус, так и весовая матрица строится из предположения независимости позиций в последовательности ФС.
4.2. Теоретические методы анализа функциональных сайтов
Анализ структуры ФС важен как для понимания понимания механизмов их действия, так и для выявления структурных особенностей, которые могут быть использованы в дальнейшем при поиске потенциальных ФС в генетических текстах.
4.2.1. Исследование встречаемости трактов в наборе последовательностей сЬункииональных сайтов. Анализ трактов (коротких подпоследовательностей генетических текстов) позволяет выявлять важные структурные особенности ФС. Если определенный тракт встречается достоверно чаще (согласно статистическим оценкам /Ш8/) в наборе выравненных последовательностей, то можно предполагать, что он имеет определенное структурное или функциональное значение (см. гл. 3).
Известно, что ряд трактов ит) &те,слсб4>,tga,tca,tctg,gag/i) имеет широкое распространение в ФС как цро-, так и зукариот /169/.
Важной характеристикой ФС является наличие политрактов (тракты, состоящие из нескольких расположенных подряд нуклеотидов одного типа) и участков потенциальной z -ДНК (последовательность чередующихся' пуринов и пиришдинов) /69/.
4.2.2. Поиск повторов различных типов. Большинство ФС содержит повторы различных типов. Наличие повторов может быть связано с механизмами их функционирования. Так,предполагается, что этим обусловлена высокая насыщенность промоторов црокариот неслучайными прямыми перекрывающимися повторами /50/. Наличие прямых и инвертированных повторов является характерной особенностью начал репликации ( ORI сайты) ряда фагов /170/. Отметим, что многие сайты рестрикации являются комплементарными палиндромалк (рис. 38) /Г71/.
73
Рио. 33. Примеры сайтов л5’...6татас...з' v 5'...етсбАс...з' рестрикции, являющихся комп-з*...cataig...з' 0 з’...сАбстб...5' лементарными палиндромами
<__ <„ (стрелками обозначены участ-
ки палиндрома), а - сайг для —> — > фермента AccI; б - сайт для
/ 5”.. .ggtnacc. . ,з’ ^ 5'..-АААттт.. .з' <юрмента AccI; в - сайт для
о 3'...CCANTGG...5’ 3'.. .ТТТААА—5’ J Г ** Т ^
<— <—
4.2.3. Анализ весовых матриц. Анализ весовых матриц позволяет выявить важные особенности структурной организации ФС.
Рассмотрим, например, промоторы ?. coli /46/, консенсусом которых считаются два участка ДНК: ТАТААТ и TTGACA., располагающиеся на расстоянии 15 - 21 п.н. друг от друга.
В работе /46/ при построении весовой матрицы промоторов использовалась выборка из М = 112 промоторов Е. coli . При равной случайной встречаемости всех оснований в кавдой позиции промотора ожидаемое количество случаев иметь заданный тип нуклеотида в любой определенной позиции равно х = М/4 = 112/4= = 28. Среднеквадратичное отклонение от этой величины (в предположении статистики Пуассона) - = j/x = 5.2. В рассматриваемой работе элемент матрицы wС i, j] вычисляется следующим образом. Пусть нуклеотид ъ встретился в позиции /
N раз. Тогда т.е. производится нормировка на ве-
личину среднеквадратичного отклонения. Получившаяся в результате такой процедуры весовая матрица приведена на рис. 39 (позиции, входящие в консенсус, отмечены "звездочками").
-45 -35
АН 88787355010 14 5 У 5 ЛС 3424435281123 И 25 “"В 32424555521 17 1233 Т 477856393 17 18 2457?
* к * * к к
-10
А 453440 20 5 12 11 0746 *(С 54545203341276 G 25587203330656 Т 10 6 8 5 6J17 1 9 3 4 20 6 5 4
К К К К N К
Рис. 39. Весовая матрица промоторов Е*. coli /46/: а -матрица для участка TTSACA; б - матрица для участка ТАТААТ.
74
Аналогично производится расчет величины, учитывающей расстояние между двумя блоками промотора. В исследуемой выборке встречается семь вариантов расстояния между блоками (от 15 до 21 нуклеотидов). При их равновероятной встречаемости в 112 промоторах количество случаев» когда имеется одно из указанных расстояний: у = 112/7 =16 (среднеквадратичное отклонение <зу = У16 =4). Элемент вектора V?s W (где i - номер одной из семи групп промоторов с определенным расстоянием между блоками) вычисляется следующим образом: vv5[i] = K^ , где В^~ количество промоторов в i~й группе. ®
Предыдущая << 1 .. 17 18 19 20 21 22 < 23 > 24 25 26 27 28 29 .. 30 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed