Научная литература
booksshare.net -> Добавить материал -> Биология -> Александров А.А. -> "Компьютерный анализ генетических текстов" -> 3

Компьютерный анализ генетических текстов - Александров А.А.

Александров А.А., Александров Н.Н., Бородовский М.Ю. Компьютерный анализ генетических текстов — М.:Наука , 1990. — 267 c.
ISBN 5-02-004691-4
Скачать (прямая ссылка): komputerniyanalizgeneticheskihtextov1990.djv
Предыдущая << 1 .. 2 < 3 > 4 5 6 7 8 9 .. 119 >> Следующая

рыты такие родственные отношения между совершенно различными генами, которых никто не подозревал. Например, обнаружение высокой степени гомологии между ростовым фактором из тромбоцитов крови человека и онкогеном вируса шерстистой обезьяны открыло новое направление в исследованиях рака, которое сейчас бурно развивается. Подробное изложение вопросов, связанных с проблемой поиска гомологий, читатель найдет в гл. 1 (Миронов А.А.).
Рост объема баз данных первичных структур биополимеров немедленно вовлек в сферу изучения генетических текстов традиционные для генетиков методы теории вероятностей и математической статистики. Статистический анализ генетических последовательностей выявил большое количество аномальных характеристик (например, обога-щенность геномов различными повторами, блоками), которые еще предстоит объяснить на функциональном уровне. Это наблюдение показало, что необходимы специальные усилия для того, чтобы корректно описать генетические тексты с помощью математических моделей, в частности с помощью аппарата теории марковских цепей. Такие модели необходимы для оценки статистической значимости гомологий, вычисления компактных информационных характеристик текстов (энтропии, избыточности и т.д.), предсказания частот встречаемости нуклеотидных "слов". В свою очередь, изучение наиболее (или наименее) распространенных слов, выявление участков генома различающихся по частоте использования некоторых "стандартных" комбинаций нуклеотидов, позволяет выдвигать новые гипотезы о функциональной роли фрагментов генетического текста и их эволюционной истории. Перечисленным вопросам посвящена гл. 2 (Бородовский М.Ю. и Певзнер П.А.).
Одной из наиболее популярных тем компьютерной генетики является идентификация в природных нуклеотидных последовательностях таких участков, которые кодируют белки. Здесь также приносят реальную пользу математические модели функциональных областей генома, построенные с помощью методов статистики. Большая или меньшая надежность предсказания зависит от степени полноты априорной информации (наличия или отсутствия обучающей выборки). Подробно об этом можно прочесть в 3-й главе (Бородовский М.Ю.).
Определенного прогресса можно ожидать в ближайшие годы в развитии методов поиска и анализа локальных функциональных сигналов в нуклеотидных последовательностях. Вероятно, применение статистических методов, методов распознавания образов, возможно, совершенно новых подходов (например, вычислительных систем типа нейронных сетей, обладающих свойствами ассоциативной памяти), позволит в ближайшие годы заметно повысить надежность теоретических предсказаний функциональных свойств последовательностей биополимеров.
За последние годы появилось значительное количество структурных данных относительно строения нуклеиновых кислот, белков и их комп-
лексов. Появление новых гипотез о структурных особенностях взаимодействия ферментов с нуклеиновыми кислотами может послужить базой для разработки эффективных программ идентификации функциональных сигналов. В 4-й главе книги (Александров Н.Н. и Каламбет Ю.А.) читатель найдет изложение вопросов, связанных с теоретическими методами распознавания функциональных сигналов.
Возникновение структурной гипотезы о функционировании нуклеиновобелкового комплекса является точкой контакта двух пока в значительной степени разобщенных направлений компьютерного анализа биополимеров - анализа нуклеотидных последовательностей и структурного анализа и предсказания вторичных и третичных структур белков. Вероятно, в ближайшие годы эти направления сблизятся и, возможно, будут объединены в едином программном комплексе.
В начале 80-х годов стало очевидно, что современному генному инженеру компьютер необходим не менее (а иногда и более) чем физи ку, химику или экономисту. Возникла необходимость в создании автоматизированного рабочего места генного инженера. При этом выявилось, что ряд задач, возникающих у генных инженеров, связан с анализом огромного количества вариантов. Такие задачи не поддаются решению при помощи "лобовых" подходов, для их анализа необходимо применение методов современной дискретной математики. Одна из та ких задач - физическое (рестрикционное) картирование молекул ДНК -рассматривается в гл. 5 (Певзнер П.А.). Физическое картирование -один из самых распространенных методов анализа ДНК. В связи с предполагаемым секвенированием генома человека объем работ по физическому картированию в ближайшие годы будет значительно увеличен. В настоящее время физическое картирование - один из разделов компьютерной генетики, где удалось "заставить" работать серьезные результаты из разных областей математики (теория графов, потоки в сетях, эргодическая теория).
Другой задаче, связанной с анализом огромного числа вариантов,-предсказанию вторичной структуры РНК - посвящена гл.6 (Кистер А.Э.). Здесь рассматриваются как комбинаторные методы решения этой задачи, так и хорошо зарекомендовавший себя в последнее время так называемый кинетический подход.
Для оперативной работы с последовательностями создаются специальные банки данных. Организация информации в банках данных, методы распространения информации и работы с ней описаны в гл.7 настоящей книги (Шепелев В.А.).
Предыдущая << 1 .. 2 < 3 > 4 5 6 7 8 9 .. 119 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed