Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 57

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 51 52 53 54 55 56 < 57 > 58 59 60 61 62 63 .. 119 >> Следующая

При вычислении частот, соответствующих каждой из моделей, использовались 62 последовательности RBS, случайно выбранные из исходных 124 последовательностей (Stormo et al., 1982а). Для сравнения моделей использовались два набора данных: 62 последовательности RBS, не использованные при вычислении параметров модели, и последовательности мРНК, из которых были вырезаны участки, содержащие известные сайты инициации трансляции. Найденные в таких мРНК иницирующие кодоны (независимо от рамки считывания) с прилегающими к ним участками последовательностей мы в дальнейшем, следуя терминологии работы Стормо (Stormo et al., 1982b), будем называть "не-RBS".
Для сравнения моделей был выбран критерий, основанный на качестве распознавания выборок, содержащих экспериментально установленные сигналы и инициирующие кодоны типа "не-RBS". Для распознавания сигналов выбиралось некоторое пороговое значение функции, превышение которого при анализе последовательности интерпретировалось как наличие в данном месте функционального сигнала. При этом возможны ошибки
Область Шайна - Дальгарно
1 F.u | F*c | fia fig
-15 0,375 0,139 0,352 0,134
-14 0, 177 0,157 0,432 0,235
-13 0,073 0,132 0,682 0,113
-12 0,040 0,018 0,138 0,804
-11 0,026 0,001 0,032 0,941
-10 0,079 0,058 0,704 0,159
-9 0,176 0,085 0,235 0,503
-8 0,246 0,102 0,385 0,267
-7 0,264 0,223 0,370 0,143
-6 0,339 0,132 0,489 0,039
Область , обедненная G
1 F, „ F. _ F, F
1G
+ 11 0,445 0,236 0,236 0,083
+12 0,356 0,132 0,405 0,107
+13 0,140 0,204 0,477 0,180
+ 14 0,292 0,212 0,421 0,075
Область инициирующего кодона
1 F,u | F.c FiA fig
-5 0,314 0,170 0,346 0, 170
-4 0,282 0, 162 0,459 0,097
-3 0, 154 0, 194 0,555 0,097
-2 0,338 0,218 0,338 0,105
-1 0,338 0,178 0,378 0,105
+ 1 0,001 0,001 0,965 0,033
+ 2 0,997 0,001 0,001 0,001
+ 3 0,001 0,001 0,001 0,997
+ 4 0,164 0,091 0,389 0,356
+ 5 0,140 0,405 0,308 0,148
+ 6 0,389 0,140 0,381 0,091
+ 7 0,091 0,244 0,485 0,180
Расстояние между областью Шайна Дальгарно и инициирующим кодоном
L= 4 5 6 7 8
0,11 0,17 0,29 0,23 0,19
Рис. 4.3. Параметры матриц для расчета функции "СТАТСАЙТ" при распознавании на последовательности сигналов инициации трансляции системы E.coli (Golovanov et al., 1982J Голованов, 1987). Нулевые элементы матриц частот встречаемости заменены малой величиной 0,001
двух типов: 1) ложная локализация функционального сигнала; 2) про-
пуск экспериментально установленного функционального сигнала.
Пороговое значение функции выбиралось так, чтобы частота ошибок обоих типов (суммарная) была минимальной. Число ошибок нормировалось на число анализируемых RBS, а количественное соотношение не-RBS и RBS соответствовало их отношению для известных последовательностей мРНК Е.со1i (Stormo et al., 1982b). Из шести анализируемых моделей на,рис.4.2 наилучшей была признана последняя. Значения параметров функции, соответствующие этой модели, приведены на рис.4.3.
На рис.4.4 приведены гистограммы распределения значений функций, полученных для моделей Б и Ж. Видно, что распределения для модели 1 перекрываются существенно меньше, чем для модели Б. Возможны следующие причины перекрывания распределений: 1) несовершенство модели, наличие каких-либо факторов, не учтенных в модели, например вторичная структура мРНК, препятствующая связыванию рибосомы, или конкурентное связывание какого-нибудь белка-регулятора; 2) наличие в выборке несайтов неидентифицированных сайтов инициации трансляции, которое может быть вызвано их относительной слабостью, синтезом коротких или нестабильных пептидов и другими причинами.
Способы вычисления матрицы весов. Большая часть алгоритмов поиска сигналов на нуклеотидных последовательностях использует аддитивный вариант вычисления дискриминирующего числа. Для этого составляется таблица, описывающая, какую величину нужно добавить к дискриминирующему числу, если встретился какой-либо признак на нуклеотидной последовательности. Обычно в качестве признаков выступают наличие определенного нуклеотида в данной позиции, реже - наличие динуклес-тида (Brendel, Trifonov, 1984), расстояние между консервативными
Рис. 4.4. Гистограммы распределений значения функции "СТАТСАЙТ" для моделей Б и Ж с рис.4.2 (Golovanov et al., 1982; Голованов, 1987)
По оси абсцисс отложено округленное значение функции "СТАТСАЙТ" е логарифмическом масштабе; по оси ординат вверх - в скольких последовательностях из выборки 128 последовательностей RBS компиляции Стор-мо (Stormo et al., 1982а) встретилось данное значение функции; пс оси ординат вниз - в скольких последовательностях из выборки не-RBF встретилось данное значение функции
блоками нуклеотидов, можно вводить и другие признаки, например наличие инвертированного повтора - последовательности, способной образовать шпильку на РНК (Brendel et al., 1986) или А+Т содержание определенных участков ДНК.
Предыдущая << 1 .. 51 52 53 54 55 56 < 57 > 58 59 60 61 62 63 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed