Биометрия - Лакин Г.Ф.
Скачать (прямая ссылка):
часто, встречаются кареглазые блондины и голубоглазые брюнеты.
208
Причиной таких "исключений" является тот факт, что каждый
биологический признак представляет собой функцию многих переменных: на
него влияют и генетические, и средовые факторы, что и обусловливает
варьирование признаков. Поэтому зависимость между биологическими
признаками имеет не функциональный, а статистический характер, когда в
массе однородных индивидов определенному значению одного признака,
рассматриваемого в качестве аргумента, соответствует не одно и то же
числовое значение, а целая гамма распределяющихся в вариационный ряд
числовых значений другого признака, рассматриваемого в качестве зависимой
переменной, или функции. Такого рода зависимость между переменными
величинами называется корреляционной или корреляцией '.
Функциональные связи легко обнаружить и измерить на единичных и
групповых объектах, однако этого нельзя проделать с корреляционными
связями, которые можно изучать только на групповых объектах методами
математической статистики. Корреляционная связь между признаками бывает
линейной и нелинейной, положительной и отрицательной. Задача
корреляционного анализа сводится к установлению направления и формы связи
между варьирующими признаками, измерению ее тесноты и, наконец, к
проверке достоверности выборочных показателен корреляции.
Зависимость между переменными Y и X можно выразить аналитически (с
помощью формул и уравнений) и графически (как геометрическое место точек
в системе прямоугольных координат). График корреляционной зависимости
строят по уравнению функции yx=f(x) или Xy=f (у), которая со времен
Гальтона получила название регрессии. Здесь ух и ху - средние
арифметические, найденные при условии, что X или Y примут некоторые
значения х или у. Эти средние называются условными. Регрессионному
анализу посвящена следующая глава. Здесь же будут рассмотрены
параметрические и непараметрические способы анализа линейных и нелинейных
статистических связей.
VIII.1. ПАРАМЕТРИЧЕСКИЕ ПОКАЗАТЕЛИ СВЯЗИ
Коэффициент корреляции. Сопряженность между переменными величинами Y
и X можно установить, сопоставляя числовые
1 Этот термин (от лат. correlatio - соотношение, связь) впервые
применил Ж. Кювье в труде "Лекции по сравнительной анатомии" (1806).
Математическое обоснование метода измерения корреляции было дано в 1846
г. другим французским ученым О. Браве. Обосновывая метод, Браве имел в
виду "теорию ошибок в плоскости", перенося закон ошибок Гаусса на случаи
двух переменных Y и X в область кристаллографии, которой он занимался.
Разработка и применение метода корреляции к измерению зависимости между
биологическими признаками были сделаны Ф. Гальтоном и К. Пирсоном. Галь-
тону принадлежит и введение термина "корреляция" в биометрию (1886).
209
значения одной из них с соответствующими значениями другой. Если при
увеличении одной переменной увеличивается другая, это указывает на
положительную связь между этими величинами, и, наоборот, когда увеличение
одной переменной сопровождается уменьшением значений другой, это
указывает на отрицательную связь. Подобную взаимосвязь устанавливают при
наличии однозначных отношений между переменными У и X, когда речь идет о
приращении или уменьшении функции по заданным значениям аргумента. Иная
ситуация наблюдается в случае варьирующих признаков. Здесь приходится
исследовать собственно не приращение или уменьшение функции, а
сопряженную вариацию (ковариацию), выражая ее в виде взаимно связанных
отклонений вариант от их средних у и х.
Ковариация (сои) есть усредненная величина произведений (Хг-х) (уг-у)
отклонений каждой пары наблюдений от их средних, т. е. cov= (lln)[L(Xi-x)
(yi-у)]. Очевидно, что величина этого показателя будет в значительной
мере зависеть от того, насколько часто в общем ряду произведение (Xi-х)
(yi-y) будет иметь один знак - плюс или минус. В первом случае пары
вариант должны отклоняться от своих средних в одном направлении (т. е.
xi>x и уОу или xi<.x и yi<.y). В другом случае, если Xi>x, то yi<y или
наоборот. При этом преобладание величин одного знака в принципе
способствует большему абсолютному значению коэффициента ковариации, так
как величины с разными знаками в сумме дают меньшую абсолютную величину.
Среднее значение всех произведений указывает, в какой мере большим (или
меньшим) значениям Xi соответствуют большие (или меньшие) значения у^
Недостаток коэффициента ковариации заключается в том, что этот
коэффициент не учитывает случаи, когда коррелируемые признаки выражаются
разными единицами измерения. Например, масса тела может коррелировать с
его линейными размерами, длина колосьев - с массой содержащихся в них
зерен и т. д. Недостаток, присущий ковариации, устраняется, если вместо
отклонений (Хг-х) (г/i-у) использовать их отношения к средним ¦
квадратическим отклонениям sx и sy. В результате получается показатель,