Научная литература
booksshare.net -> Добавить материал -> Биология -> Хедрик Ф. -> "Генетика популяций " -> 168

Генетика популяций - Хедрик Ф.

Хедрик Ф. Генетика популяций — Техносфера, 2003. — 592 c.
ISBN 5-94836-007-5
Скачать (прямая ссылка): genetikapopulyaciy2003.djvu
Предыдущая << 1 .. 162 163 164 165 166 167 < 168 > 169 170 171 172 173 174 .. 223 >> Следующая

2(N - 2)
[(N-2 )Dlj+R,-RJ]
и
(9.11b)
DM = j(D,, +DJk -Z),).
(9.11c)
Новые расстояния между узлом А и другими таксонами можно вычислить из выражения 9.11с, они представлены слева в таблице 9.136. Теперь процесс определения новых значений S повторяется с этими новыми расстояниями (вычисляются новые значения Т и R на основе этих расстояний, см. справа в таблице 9.13Ь). Когда остается четыре таксона, то при использовании ОС равновероятны два кластера: АЗ и 12. Новый узел В образуется, соединяя А и 3, длина ветви от таксона В до 3 равна Ью = 0,060. Новый узел С образуется, соединяя 1 и 2, длина ветви от С до 1 равна ЬС[ = 0,042 и от С до 2 равна Ьа = 0,053. Наконец, дерево можно изобразить в масштабе, не включая узлы, как на рисунке 9.12Ь. Заметьте, что в этом случае топология такая же, как и при использовании метода НПГМ, и длины ветвей также очень сходны.
ТАБЛИЦА 9.13. Ряды, используемые методом объединения соседей, для данных, представленных в таблице 9.11 по всем пяти таксонам (а) и после объединения 4 и 5 таксонов (Ь). Жирным шрифтом обозначены наименьшие значения
(а) S
У
1 2 3 4
2 0,437 - - -
3 0,444 0,440 - -
4 0,454 0,457 0,452 -
5 0,455 0,455 0,453 0,427
(Ь) D S
У и
А 1 2 А 1 2
1 0,087 - - 1 0,205 - -
2 0,102 0,095 - 2 0,207 0,202 -
3 0,099 0,113 0,118 3 0,202 0,207 0,205
Когда таксонов много, то появляется множество топологий дерева и поэтому определение уровня статистического доверия для различных частей дерева становится критическим. Наиболее обычный подход - определение уровня статистического доверия в конкретном узле дерева с помощью расчета бутстрепных значений (Felsenstein, 1985). Бутстреп-пинг (bootstrapping) - это подход, который перевыбирает исходные данные для получения уровней значимости. В этом случае выборка получается случайной, филогенетическое дерево изображается для этой выборки, и изучают дерево, определяя, какие кластеры ОТЕ оно содержит. Обычно этот процесс повторяется много раз, скажем 1000, и про-
цент случаев, в котором данный кластер представлен, обозначается на дереве. Например, бутстрепные значения в таблице 9.12 (из Nei, Kumar, 2000) обозначают, что для обоих деревьев кластер человек-шимпанзе-горилла высоко обеспечен (в 100% перевыбранных деревьев содержался этот кластер). Кластер человек и шимпанзе обеспечен (90%) для дерева, построенного методом НПГМ и несколько ниже - для дерева, построенного методом ОС (71%).
с. Максимальная экономия
Метод максимальной экономии (парсимонии) идентифицирует дерево (или деревья), которое включает наименьшее количество мутаций, необходимых для объяснения различий между изучаемыми группами (Fitch, 1977). Такие деревья часто очень информативны. Однако, как видно из простого примера, можно построить несколько деревьев с одинаковым минимальным количеством мутаций. К тому же, обнаружение наиболее экономичного дерева не гарантирует, что это дерево правильное: если скорости замен варьируют вдоль разных линий происхождения, экономия может не привести к правильной топологии дерева.
Для построения дерева методом максимальной экономии сначала нужно идентифицировать информативные сайты, которые поддерживают одно филогенетическое дерево через другое. В качестве иллюстрации используем четыре таксона с последовательностями, данными в таблице 9.14. Для четырех таксонов возможны три неукоренивших-ся дерева (рисунок 9.14а), и нужно определить, является ли одно из этих деревьев наиболее экономичным объяснением представленных данных, чем другие.
Следуя по этим сайтам шаг за шагом можно видеть, что сайт 1 не информативен, потому что все последовательности идентичны по Т и поэтому не требуют замен. Сайт 2 также не информативен, потому что единственная мутация в ветви, ведущей к таксону 1, для любого из трех деревьев дает эту же картину. В сайте 3 существуют три различных нуклеотида, но он также не информативен. Рисунок 9.14Ь показывает, что для построения всевозможных деревьев необходимы минимум две замены. С другой стороны, сайт 5 - информативный (рисунок 9.14с). В этом случае, дерево А требует только одной замены между двумя внутренними узлами дерева, тогда как деревья В и С требуют по две замены. Сайт 6 также информативен, и для него дерево С требует только одну замену, тогда как деревья А и В требуют двух. Итак, для информативности сайта он должен иметь минимум два разных нуклеотида, и каждый из этих нуклеотидов должен быть представлен, по крайней мере, дважды.
ТАБЛИЦА 9.14. Гипотетические последовательности в семи нуклеотидных сайтах из четырех различных таксонов, иллюстрирующие метод максимальной экономии. Информативные сайты обозначены знаком *
Предыдущая << 1 .. 162 163 164 165 166 167 < 168 > 169 170 171 172 173 174 .. 223 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed