Научная литература
booksshare.net -> Добавить материал -> Биология -> Эбилинг В. -> "Физика процессов эволюции" -> 145

Физика процессов эволюции - Эбилинг В.

Эбилинг В., Энгель А., Файстель Р. Физика процессов эволюции — М.: УРСС, 2001. — 342 c.
Скачать (прямая ссылка): fizikaprocessovevolucii2001.djvu
Предыдущая << 1 .. 139 140 141 142 143 144 < 145 > 146 147 148 149 150 151 .. 176 >> Следующая

т = Y. р*(л.а) in
pHAiAj)
,p(Ai) p(Aj)
(11.35)
Здесь pk(AiAj) — вероятность найти в последовательности буквы А{ и Aj на расстоянии к одну от другой. При к ^ 3 трансинформация 1(к) вычисляется значительно легче, чем Нw или hk. Например, при анализе ДНК для оценки рассматриваемой
последовательности необходимо знать только 16 вероятностей. На рис. 11.9 показан результат анализа ДНК вируса саркомы Ру. Пики распределения соответствуют корреляциям. Вплоть до максимума к = 3 все наблюдаемые максимумы кратны трем, что, возможно, является следствием принципа кодирования.
Рис. 11.9. Трансинформация для ДНК вируса саркомы Ру. Штриховая линия соответствует цепи Маркова первого порядка (Ebeling et al., 1987)
Для обеспечения структуры и функционирования живых организмов, как оказалось, необходимо огромное количество информации, хранимой наследственностью. Еще Шрёдингер, которому не была известна молекулярная основа наследственности, постулировал существование нерегулярной молекулярной структуры — «апериодического кристалла» — как единственно мыслимой возможности для принципа кодирования. Для полинуклеотидов длины v существуют 4" различных вариантов расположения элементарных звеньев, откуда для информационной емкости получаем:
In 4"
I - -—— = 2v в битах (двоичных единицах),
In 2
I = v в четверичных единицах.
(11.36)
Для полипептида из 20 элементарных звеньев для информационной емкости получаем:
In 20"
1= ~bT==V"4)3219 ВбИТЗХ’ (11.36)
I = v в двадцатиричных единицах.
Эти соотношения носят общий характер, и при выводе их не используются никакие предположения об информационном содержании отдельного конкретного полинуклеотида или белка. Интуитивно ясно, что упорядоченная структура с определенными симметриями может переносить меньшее количество информации, чем апериодическая структура. Например, последовательности
р, = ААААЦЦЦЦ или P2 = АЦАЦАЦАЦАЦ содержат меньше информации, чем последовательности
Рз = АЦТГГАТЦ или р4 = ГЦЦАГААЦГТ,
поскольку последовательности pj и рг могут быть построены по простому и краткому правилу, в то время как в структуре последовательностей рз и Р4 не обнаруживается никакой регулярности.
Информационная емкость, измеренная в некоторых выбранных единицах (обычно в битах), играет в каждом случае важную роль в качестве верхней границы подлежащего измерению информационного содержания носителя, каким бы оно ни было. Если носитель информации, обладающий информационной емкостью I, полностью и без избыточности загружен сообщениями, то сообщение может быть передано без потерь другому носителю информации (причем независимо от способа кодирования — с помощью частотной или амплитудной модуляции, цифрового или аналогового представления в виде функции или интегрального преобразования) только в том случае, если другой носитель обладает такой же информационной емкостью I. Так как хромосомы содержат около 109 нуклеотидов, можно исходить из того, что их емкость как запоминающего устройства согласно формуле (11.35) соответствует удвоенной длине и составляет около 2 - 109 битов. Представим себе наглядно величину емкости такой памяти. Для этого подсчитаем, сколько книг объемом в 500 страниц потребуется, чтобы вместить такое количество информации. Для каждого из 32 знаков нашего алфавита требуется In 32/1п 2 = 5 битов. Это означает, что с помощью последовательности ДНК можно закодировать около
4 • 108 букв или при средней длине слова в 6 букв — около 6 • 107 слов. Поскольку обычная печатная страница содержит около 300 слов, емкость последовательности ДНК как запоминающего устройства составляет примерно 2 • 105 печатных знаков, т. е. соответствует небольшой библиотеке в 400 томов. Такой же емкостью памяти обладали бы 100 магнитофонов, каждый из которых может хранить на магнитной ленте 512 • 1024 • 48 битов.
Обсуждаемая нами сейчас мера информации — информационная емкость, или емкость запоминающего устройства, не зависит от формы- хранения информации и, как показывают примеры, легко вычисляется для любого конкретного запоминающего устройства.
Попытаемся теперь придать более точный смысл интуитивному понятию информационного содержания данной конкретной структуры. Прежде всего ясно, что реальное информационное содержание 1(р) данного конкретного запоминающего устройства или последовательности р не может быть больше информационной емкости I, поскольку последняя является верхним пределом для 1(р):
информационное содержание /(р) «С информационная емкость /. (11.37)
Напрашивается предположение о том, что информационное содержание последовательности находится в тесной связи с информационной энтропией источника сообщений, определяемой как средняя неопределенность, устраняемая на один символ. Так как информационная энтропия определяется свойствами источника, а с другой стороны информационное содержание возрастает с увеличением длины последовательности, однако эти меры не тождественны. Итак, мы отчетливо видим, что информационное содержание является мерой информации, отличной от информационной энтропии. В то время как информационная емкость книги объемом в 500 страниц, согласно приведенным выше расчетам, составляет около 5 • 106 битов, реальное информационное содержание такой книги, как правило, существенно меньше. Например, если наша книга состоит только из повторений высказывания Фауста «В начале было дело», то ее информационное содержание, несомненно, не идет ни в какое сравнение с информационным содержанием научного труда того же объема. Вместе с тем вполне возможно, что какой-нибудь первоклашка извлечет из такой «Фаустовской книги» больше информации, чем от чтения
Предыдущая << 1 .. 139 140 141 142 143 144 < 145 > 146 147 148 149 150 151 .. 176 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed