Биометрия - Лакин Г.Ф.
Скачать (прямая ссылка):
Эти формулы особенно удобны при определении параметров эмпирических
уравнений рядов динамики (см. ниже).
Множественная линейная регрессия. Зависимость между несколькими
переменными величинами принято выражать уравнением множественной
регрессии, которая может быть линейной и нелинейной. В простейшем виде
множественная линейная регрессия выражается уравнением с двумя
независимыми переменными величинами (х, г):
где а - свободный член уравнения; b и с - параметры уравнения. Для
нахождения параметров этого уравнения (по спосо-
266
ап + Ъ 2(*/ -*) -- ^ ; а ^{xl - x)+b^(xl - xf-'2i(yl - y){xt - x).
Ух^У+Ьу^ - ху, (188)
ап-\-Ь - -*) = 2 У'
а^{х1 - х)Л-ъ '^i(xi - xy^'^ly(xt - x).
ап = ^у\ by2i(xl - xf=^'^iy{xi - x).
(189)
S У (*/-_*)
S(*/-*)2
(190)
y=a-\-bx-{-cz,
(191)
бу наименьших квадратов) применяют следующую систему нормальных
уравнений:
ап+ь 2xJr ° 2 г=^У'
<*2*+&2*2+c 2 *z==2 ху'
а 2*+& 222:2=2^
Чтобы по эмпирическим данным составить такую систему, необходимо
предварительно рассчитать 2*, 2г/, 2,yz, I,xz, 2л:2 и 2z2.
Пример 6. Найти эмпирическое уравнение регрессии между числом колосков
у, количеством зерен z и длиной колосьев X у озимой ржи. Данные о
корреляционной зависимости между этими признаками приведены в табл. 115.
Объем выборки п= = 10. Предполагая линейный характер связи между этими
признаками и учитывая их буквенные обозначения, возьмем за исходное
уравнение регрессии уравнение вида
x-a-\~by-\~cz,
которому отвечает выше приведенная система нормальных уравнений.
Необходимые суммы см. в табл. 115. Подставляем йх в уравнения системы:
10а + 1656 + 294с=575;
165а + 28916 + 5202е=9908;
294а + 52026 + 9456с = 17816.
Чтобы решить эту систему относительно параметров а, 6 и с, разделим
каждое уравнение на коэффициент при а, что дает:
а + 16,50006+29,4000с=57,5000; (I)
а + 17,52126 + 31,5273е=60,0485; (II)
а+17,69396 + 32,1633с ==60,5986. (III)
Затем, вычитая первое уравнение из второго, а второе-из третьего, получим
1,02126 + 2,1273?=2,5485;
0,17276+0,63606=0,5501.
Разделим каждое уравнение на коэффициент при 6 и найдем разность между
полученными уравнениями:
Ь 4-2,0831с =
2,4956 " Ь + 3,6827с = 3,1853
- 1,5996с = -0,6897
267
q gggj
Отсюда с--'¦--------=0,4312. Подставляя в одно из этих урав-
-1,5996
нений вместо с его значение, находим 6+2,0831(0,4312) = = 2,4956, откуда
6 = 2,4956-0,8982= 1,5974.
Наконец, в первое (исходное) уравнение вместо b и с подставляем их
значения: 10а+165(1,5974)+294(0,4312) = 575. От-575 -390,3438
184,6562 "
сюда а=---------^^- =18,466. В итоге
.^ = 18,466+ l,597t/ + 0,43lz.
Подставляя в это уравнение задаваемые значения переменных у и г, можно
определить ожидаемую величину переменной х, т. е. среднюю длину колосьев
этой культуры. Так, для у= 10 и z=8 ху = 18,466+10(1,597) +8(0,431) =
37,334" 37,9 см; для у-15 и z=14 средняя длина колоса *у=
18,466+15(1,597) + +14 (0,431) = 48,455ж 48,5 см и т. д.
Найденное эмпирическое уравнение регрессии показывает, что при
изменении длины колосьев X на 1 см число колосков Y при постоянном
количестве зерен Z изменится в среднем на
1,60, а число Z при постоянной величине Y изменится в среднем на 0,43.
Ряды динамики. Выравнивание рядов. Изменение признаков во времени
образует так называемые временные ряды или ряды динамики. Характерной
особенностью таких рядов является то, что в качестве независимой
переменной X здесь всегда выступает фактор времени, а зависимой Y -
изменяющийся признак. В отличие от рядов регрессии зависимость между
переменными X и Y носит односторонний характер, так как фактор времени не
зависит от изменчивости признаков. Несмотря на указанные особенности,
ряды динамики можно уподобить рядам регрессии и обрабатывать их одними и
теми же методами.
Как и ряды регрессии, эмпирические ряды динамики несут на себе
влияние не только основных, но и многочисленных второстепенных
(случайных) факторов, затушевывающих ту главную тенденцию в изменчивости
признаков, которая на языке статистики называется трендом.
Анализ рядов динамики начинается с выявления формы тренда. Для этого
временной ряд изображают в виде линейного графика в системе прямоугольных
координат. При этом по оси абсцисс откладывают временные точки (годы,
месяцы и другие единицы времени), а по оси ординат - значения зависимой