Научная литература
booksshare.net -> Добавить материал -> Биология -> Лакин Г.Ф. -> "Биометрия " -> 117

Биометрия - Лакин Г.Ф.

Лакин Г.Ф. Биометрия — Высшая школа, 1990. — 350 c.
Скачать (прямая ссылка): biometriya1990.djvu
Предыдущая << 1 .. 111 112 113 114 115 116 < 117 > 118 119 120 121 122 123 .. 155 >> Следующая

45,0+45,8=90,8. Затем определяем сумму следующих двух членов:
45,8+44,3=90,1; 44,3+41,9 = 86,2 и так до конца ряда. Затем каждую
полученную таким образом сумму делим на число слагаемых, в данном случае
на два, и находим усредненные значения членов ряда: 45,4 45,0 43,1 41,0
39,6 38,2 37,5. Получился выровненный ряд, более наглядно
свидетельствующий о наличии отрицательной корреляции между этими
признаками.
Разумеется, в разных случаях способ скользящей средней применяют по-
разному, вычисляя средние не из двух или трех, но и большего числа членов
ряда.
Метод наименьших квадратов. Этот способ предложен в начале XIX
столетия А. М. Лежандром и независимо от него К. Гауссом. Он позволяет
наиболее точно выравнивать эмпирические ряды. Этот метод, как было
показано выше, основан на предположении, что сумма квадратов отклонений
вариант Xi от их средней х есть величина минимальная, т. е.
Л
^ (Х[ - x)2=min. Отсюда и название метода, который приме-1-\
няют не только в биологии, но и в технике. Метод наименьших квадратов
объективен и универсален, его применяют в самых различных случаях при
отыскании эмпирических уравнений рядов регрессии и определении их
параметров.
Требование метода наименьших квадратов заключается в том, что
теоретические точки линии регрессии ух' должны быть получены таким
образом, чтобы сумма квадратов отклонений от этих точек для эмпирических
наблюдений г/* была минимальной, т. е.
Q =2 (у' ~ ^ = 2 ~ f W)2=Qmin-
Вычисляя в соответствии с принципами математического анализа минимум
этого выражения и определенным образом преобразуя его, можно получить
систему так называемых нормальных уравнений, в которых неизвестными
величинами оказываются искомые параметры уравнения регрессии, а известные
коэффициенты определяются эмпирическими величинами признаков, обычно
суммами их значений и их перекрестных произведений. В частности, такая
система нормальных уравнений, полученная для прямолинейного уравнения
регрессии, приведена выше, в разд. IX. 1.
Сущность метода практически уже раскрыта на конкретных примерах,
которые рассмотрены выше - при отыскании параметров а и b линейной
регрессии. При этом расчет параметров
264
производили непосредственно по значениям варьирующих признаков Y и X
(малые выборки).
Теперь следует выяснить, как применяется этот метод к выборкам,
группируемым в вариационные ряды и корреляционные таблицы (большие
выборки). Начнем с отыскания эмпирических уравнений регрессии обхвата
груди Y по росту X и роста по обхвату груди мужчин. Чтобы решить эту
задачу, необходимо предварительно рассчитать средние арифметические у их,
средние квадратические отклонения sy и sx и вычислить коэффициент
корреляции гху между этими признаками. Читателю предлагается (по примеру
расчета гху между массой тела и годовым удоем коров горбатовской породы)
вычислить эти величины, которые оказались равными у-85,17; jc= 164,62; sy
- = 2,02; sx-2,73 и /*,,=0,391.
Переходим к определению параметров регрессии обхвата груди Y по росту
X и роста по обхвату груди мужчин. Так как ку-Кх=2, то эти величины можно
не учитывать при определении параметров Ьух и Ьху [см. формулу (178)]:
Ь"*=г,"-= 0,391 =0,289 и
Ьху =гху -^ = 0,391 -Ц- = 0,528;
аух=у-Ьухх=85,17 - 0,289 -164,62 = 85,17-47,58=37,59
и аху=х - Ьхуу = 164,62 - 0,528-85,17= 164,62-44,97= 119,65.
Отсюда эмпирическое уравнение регрессии обхвата груди по росту
г/*=0,289л;+37,59, а эмпирическое уравнение роста по обхвату груди
%=0,528г/+119,65.
Сумма членов ряда ух регрессии, рассчитанных по корреляционному
уравнению, должна быть равна сумме членов эмпирического ряда, т. е.
2г/*=2у/. Если окажется, что Ъух'Ф Ф2ух или ¦2хуф2ху (как следствие
приближенных вычислений параметров), нужно эмпирические уравнения
регрессии скорректировать так, чтобы указанные равенства осуществлялись.
В данном случае этому условию удовлетворяют уравнения г/*=0,289л:+37,5 и
%=0,528г/+119,1. Рассчитанные по этим уравнениям значения ух и ху
изображены в виде плавно идущих (сглаженных) линий регрессии Y по X и X
по Y на рис. 28. Они неплохо согласуются с эмпирическими (ломаными)
линиями регрессии.
Уравнение линейной регрессии можно выразить в виде отклонений членов
ряда от их средних:
ух - у=Ьух(х - х); ху - х,=Ьху(,у - у). (187)
265
Система нормальных уравнений в этом случае будет выглядеть так:
Так как 2(г/i-у)~0 и 2,(х~х)-0, то параметр определяют по формуле (187),
а параметр а легко найти по формуле (183).
Если средние у и х перенести в правую часть уравнения (187), то
получим
Система нормальных уравнений для определения параметров а и Ь будет
следующая:
Так как 2(х-*)=0, то система уравнений оказывается такой:
Отсюда параметры уравнения линейной регрессии, выраженной в виде
отклонений членов ряда от их средних величин, оказываются следующими:
Предыдущая << 1 .. 111 112 113 114 115 116 < 117 > 118 119 120 121 122 123 .. 155 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed