Биометрия - Лакин Г.Ф.
Скачать (прямая ссылка):
требуется очертить зону, включающую в себя определенный
Таблица 135
| Длина тела х{ Обхват груди ух (Xf---X)lsx 1 У + tsu
X х Ух
[
148,5 80,5 ---2,95 73,2 87,8
150,5 81,1 ---2,58 73,8 88,4
152,5 81,6 ---2,22 74,3 88,9
154,5 82,1 ---1,85 74,8 89,4
156,5 82,7 ---1,48 75,4 90,0
158,5 83,3 ---1,12 76,0 90,6
160,5 83,9 -0,76 76,6 91,2
162,5 84,5 ---0,38 77,2 91,8
164,5 85,0 ---0,02 77,7 92,3
166,5 85,6 0,35 78,3 92,9
168,5 86,2 0,71 78,9 93,5
170,5 86,7 1,08 79,4 94,0
172,5 87,4 1,45 80,1 94,7
174,5 87,9 1,81 80,6 95,2
176,5 88,6 2,18 81,3 95,9
(роцент всех эмпирических наблюдений, располагающихся возле 1инии
регрессии. В этом случае может быть использована формула квадратической
ошибки отдельного наблюдения
- 1 /" 1 I 1 I {х ~х)2
syx - syx I/ 1 + -i--------j
х \ я nsx
i доверительный интервал будет иметь границы
Ух i ^syx'
де t имеет k=n-2. Следует заметить, что границы доверительного интервала
для разных значений х будут расширяться в той iepe, в какой эти значения
будут отличаться от среднего уровня х.
Пример 25. По данным примера с нахождением уравнения репрессии длины
тела X и обхвата груди Y найти доверительный штервал для индивидуальных
значений, включающих 95% всех наблюдений. Воспользуемся для этого
регрессией Y по X. Исход-
301
ными данными для примера являются значения х -164,6; sy= =4,04; "*=5,46;
гжу=0,391 и п=727.
Сначала найдем остаточную дисперсию признака У. Она равна s^=4,04
- 0,3912(726/725)=3,72. Затем требуется най-
ти нормированные отклонения для середин классовых интервалов по признаку
X. Эти значения приведены в табл. 135. После этого для каждого классового
интервала находим квадратическую ошибку sVx, на основании которой легко
рассчитываются границы доверительного интервала.
Например, для первого класса эти границы определяют следующим
образом. Квадратическая ошибка отдельного наблюдения Sy^-3,72 У \ -|-
1/727- 2,95)2/727 = 3,74. Нижняя граница
доверительного интервала равна 80,5-1,96-3,74 = 73,2, а верхняя его
граница равна 80,5+1,96-3,74=87,8. Границы доверительного интервала для
отдельных наблюдений в соответствии с линией регрессии обхвата груди У по
длине тела X приведены на рис. 41. Эти границы можно считать своего рода
нормативом формы тела. Если некоторое наблюдение окажется на графике
расположенным ниже нижней границы, то для такого индивида можно
констатировать нетипичное сочетание значений двух признаков, когда обхват
груди по отношению к длине тела характеризуется весьма слабым развитием.
Y
Рост, см
Рис. 41. Доверительная зона регрессии окружности груди Y по
росту X мужчин, включающая 95% всех наблюдений
302
Следует также отметить еще одно обстоятельство, проявившееся в данном
примере. В общем случае доверительные границы отдельных наблюдений должны
расширяться по мере удаления значений признака X от центральной точки.
Однако этот эффект будет выражен тем больше, чем меньше окажется объем
выборки. В данном случае этот объем достаточно велик и границы
доверительного интервала обнаруживают весьма слабую кри-волинейность.
Так, для первого классового интервала ширина границ 87,8-73,2 = 14,6,
тогда как для центрального класса она составляет 92,3-77,7=14,6. Это
объясняется тем, что объем выборки достаточно велик, что обусловливает
небольшую величину
/J (х __jc)^
1 _)----j---------t учитывающего сте-
" Jis2x
пень отклонения точек я,- от центра х.
Решая такую задачу, следует иметь в виду, что использование уравнений
линейной регрессии допустимо лишь в тех случаях, когда исходные данные
распределяются нормально или же их распределение не очень сильно
отклоняется от нормальной кривой. Если же генеральная совокупность, из
которой извлечена выборка, распределяется по другому закону, применять
уравнение линейной регрессии к нормативным оценкам варьирующих объектов
нельзя. В таких случаях более подходящими будут ие-параметрические
оценки, в частности перцентильные, о которых шла речь выше.
IX.4. ВЫБОР УРАВНЕНИЙ РЕГРЕССИИ
Важной задачей в области регрессионного анализа является выбор
уравнения, которое бы наилучшим образом описывало исследуемую