Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 36

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 30 31 32 33 34 35 < 36 > 37 38 39 40 41 42 .. 119 >> Следующая

Энтропия и эволюционные связи генетических текстов. Величины энтропии и избыточности различаются не только для различных функциональных областей ДНК, но и для ДНК разных организмов. Например, в табл. 2.9 приведены значения S и R (определенные по марковским моделям второго порядка) для геномов вирусов и плазмиды PBR322 (Гусев и др.,1980).
Видно, что увеличение избыточности и одновременно уменьшение энтропии происходит в ряду от MS2 к SV40. У генома MS2, избыточность которого минимальна, гены практически не перекрываются друг с другом. Геномы вирусов G4, ФХ174, SV40 имеют зоны перекрытия функциональных единиц иногда весьма обширные. Такого рода наложения увеличивают число ограничений, которым должна удовлетворять нуклеотидная последовательность, и повышают ее избыточность.
Таблица 2.9 Значения функций энтропии и избыточности
Функция | MS2 | PBR322 I- G4 | ФХ174 1 FD | SV40
S 1,985 1,974 1,937 1,932 1,928 1,880
R 0,007 0,013 0,031 0,033 0,036 0,055
Полезными характеристиками генетических текстов являются величины:
D, " Sn,ax- S,
D2 = S - S\
Значение D, можно интерпретировать как меру отклонения рассматриваемой последовательности от случайной, описываемой равновероятной моделью. В свою очередь, величина D2 может служить мерой отклонения от модели, предусматривющей независимое порождение символов, но, возможно, с неравными вероятностями (Gatlin,1975). Заметим, что имеет место соотношение R-log2M = Dj+D2.
Например, было установлено (Lipman,Maizel,1982), что кодирующие области внехромосомной ДНК эукариот имеют (при фиксированной величине R) большее значение D1 и меньшее D2, чем кодирующие области ДНК прокариот, бактериофагов, вирусов и хромосом эукариот. Это говорит о том, что внехромосомные гены менее сбалансированы по нуклеотидному составу, и соседние нуклеотиды в них менее з.ависимы, чем в генах других типов ДНК. Другой результат, отмеченный теми же авторами, заключается в том, что эукариотические кодирующие последовательности, не содержащие интронов имеют (также при фиксированном значении R) большую величину D1 и меньшую величину D2, чем кодирующие последовательности эукариот, включающие интроны. Это в известной мере является неожиданным, так как свидетельствует о том, что в интронах наблюдаются корреляции соседних нуклеотидов, причем более сильные, чем в экзонах.
Интересно, что на больших выборках кодирующих последовательностей ДНК, величина D2 в ряду митохондрии, прокариоты, эукариоты - принимает значения 0,019, 0,042 и 0,087 соответственно, что свидетельствует об увеличении корреляции между соседними нуклеотидами молекул ДНК в данном таксономическом ряду. Показано (Lipman,Wilbur,1983), что этот эффект связан в первую очередь с увеличением коррелирован-ности типов соседних нуклеотидов на границах кодонов.
В связи с тем, что в кодирующих областях ДНК возможно несколько биологически обоснованных кодировок структуры молекул, возникает естественный вопрос - как это отразится на значениях информационных характеристик.
Представим кодирующую область ДНК в виде последовательности кодонов, i.e. в виде последовательности в алфавите из 64 символов. Величина энтропии на один символ здесь будет определяться по формуле (2.19), в которой М=64, а величины Р, будут равны частотам встречаемости кодонов i=l, 2........64. Аналогично (при М=20) подсчитывает-
ся и энтропия аминокислотных последовательностей. Как уже говорилось, энтропия есть величина математического ожидания информации об исходе эксперимента (см.2.19), поэтому энтропия на символ (удельная энтропия) характеризует среднее посимвольное информационное содержа-
ние (в смысле Шеннона). Ясно, что величина удельной информации для последовательности кодонов, будет превышать величину удельной информации для той же последовательности, записанной в алфавите аминокис-.лот, поскольку первая из них может рассматриваться как результат выбора из большего числа возможных вариантов (в силу большей мощности алфавита). Значения удельной энтропии кодоновых и аминокислотных последовательностей реальных организмов приводятся в табл.2.10 (Konopka,1984).
Таблица 2.10
Значения удельной энтропии матричных РНК и белков
Группа Энтропия мРНК Энтропия
организмов белка
РНК-вирусы 5,810 4,133
ДНК-вирусы 5,757 4,194
Бактерии 5,631 4,133
Позвоночные 5,600 4,090
Человек 5,522 4,155
Здесь видна интересная особенность: удельная энтропия кодоновых последовательностей уменьшается по мере перехода к более высоким ступеням эволюционной лестницы, хотя удельная энтропия аминокислотных структур, кодируемых этими последовательностями кодонов, остается примерно постоянной. Таким образом, информационное содержание на символ в кодоновых последовательностях в ходе эволюции уменьшается (при одновременном увеличении длины генома) и увеличивается избыточность R, характеризующая помехоустойчивость генетического текста. Такое развитие событий на уровне мРНК представляется вполне естественным. С другой стороны, постоянство удельной энтропии первичных структур белковых молекул (не претерпевших, в среднем, увеличения в размерах по сравнению с низшими формами) говорит об их статистической однородности в таксономическом ряду и достаточном "функциональном" совершенстве уже на начальной стадии эволюции. Указанная интерпретация, по-видимому, находится в соответствии и с представлениями теории ”нейтральности" (Кимура, 1985).
Предыдущая << 1 .. 30 31 32 33 34 35 < 36 > 37 38 39 40 41 42 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed