Прогнозирование здоровья детей раннего возраста - Степанова Е.И.
Скачать (прямая ссылка):
Г л а в а И!
ПРОГНОЗИРОВАНИЕ ЗДОРОВЬЯ ДЕТЕЙ РАННЕГО ВОЗРАСТА И ЕГО РОЛЬ В ПРОФИЛАКТИКЕ ЗАБОЛЕВАНИЙ
3.1. Математические аспекты прогнозирования здоровья детей
Как отмечалось, задача прогноза здоровья ребенка заключается в том, что на основании факторов, действующих на организм с прошлом, и на основании текущего состояния организма предсказываются с определенной вероятностью состояние здоровья в будущем и риск возникновения какого-либо заболевания, его течения и исхода. В такой постановке при применении математических методов необходимо иметь набор показателей Xi, i- 1, М, характеризующих состояние организма в прошлом и настоящем, а также набор некоторых обобщенных признаков yKi к=1,е, определяющих то или иное заболевание. При этом среди показателей -х{ и признаков ук могут быть количественные и качественные.
Естественно, что из всех показателей х* необходимо выбирать для прогноза только те, которые существенно влияют на признаки у,;. Задача прогноза сводится к тому, чтобы по измеренным показателям обследуемого ребенка х,- вычислить с помощью определенных решающих правил (алгоритмов) обобщенные признаки ук и но полученным результатам сделать заключенно о состоянии здоровья с заданным заранее риском ошибки.
Большинство решающих правил используют методы статистики, основанные на применении прогностических коэффициентов и обучающих выборок, составленных из группы детей о известным состоянием здоровья. Для формировании и оценки прогностических коэффициентов наиболее часто применяют корреляционный анализ, регрессионный анализ и последовательный анализ Вальда (см. табл. 1). Степень тесноты связей для количестве
Ценных признаков устанавливается по выборочному коэффициенту корреляции, вычисляемому из соотношения
х,)()'<" ¦?,)
¦' 0, = ^-----(17)
, . XIй ук
где i=l,M - число показателей, характеризующих состояние организма; к - 1,е - число обобщенных признаков; j \,N-количество измерений, равное числу детей, входящих в обучающую группу;
1 " t N
**= дг2х,}'Ук = jv
1-1
''Vbb^-y-r
Y
Значимость коэффициента корреляции гы можно устанавливать по критерию, определяемому неравенством
l^L^P-2>^(iV--2), (19)
где ta{N-2) определяется по таблице распределения Стьюдента с N-2 степенями свободы при уровне значимости а.
Для качественных признаков степень тесноты связи устанавливается по ранговому коэффициенту парной корреляции
г , = 1 _ J=i___(20)
р'к 1 N*-N
где
-Ук}- (21)'
Значимость ранговой корреляции вычисляется по критерию, определяемому неравенством
I ^pin
(22)
87
¦ Регрессионный анализ, как правило, , используется для определения статистической зависимости между величинами, с помощью которой можно прогнозировать усредненные показатели зависимых переменных ук по заданным значениям независимых переменных Х{.
Для получения многофакторных прогнозов используют линейное уравнение множественной регрессии, имеющее вид [Львовский Е.-М., 1982]:
jVi: (23)
. : : . . /-1 л
где уп - предсказываемые значения зависимых показателей;
Xi - значения независимых показателей;
biK - коэффициенты регрессионного уравнения.
Коэффициенты Ьы определяются по методу наименьших квадратов из условия минимизации выражения
N N .и
2 <-vj> ~ yj*)2 = 2 \У)к - 2 ьп:хр}2 ^ mln, (24)
J--1 i 1 i=\
л
где у;т - вычисляемые предсказываемые значения зависимых показателей для / наблюдения;
-значения зависимого показателя для j - ),N наблюдения.
Может случиться, что линейное уравнение множественной регрессии дает большую остаточную дисперсию 5о;Т , которая представляет собой ошибку предсказания уравнением регрессии результатов опыта, где
а> - wzs-i ~ У*у' <25)
В подобной ситуации экспериментальные данные необходимо аппроксимировать нелинейной множественной регрессией. При этом можно надеяться, что ' нелинейное уравнение даст меньшую остаточную дисперсию Я-
О ост.
Первый этап нелинейного множественного регрессионного анализа - это получение квадратичной формы
Уг Ь(,к г h\KX\. *Г ••• "!" Ьм:;Х\\ -J- Ьц*? ~Г Н"
4- Ьл-м,;ХД{ -f Ь1гххХо... (26)
S8
Цепень уравнении попытается до тол пор, пока мёньшается остаточная дисперсия S(;Cf. Начиная со йгорого шага, каждому повышению степени полинома йедшестсуст з.'шен.! переменны <, лшю.-ши.зуюшая |ун кип и
[fa-M -= x'i, -V i;.2 - x\, x ;и.; _ .-cj ii т.д после чего коэффициенты нового "расширенного" линейного полинома Определяют по методу наименьших квадратов.
& Другой формой проведения нелинейного регрессионного анализа является использование так называемых |внутренне линейных" форм уравнений, т. е. форм, которые легко линеаризуются логарифмированием или дру-шми преобразованиями. К таким моделям относятся
| У к = biiKx^l,;xJ''K ...xMb-"K. (27)
Логарифмируя это уравнение по основанию 6, переводят его в линейную форму
['• ill ук In Ь0к -ь ьхк 1п х| -f-----1- />Мк In хм. (28)
Далее проводится замена переменных
г.' у',с - In у*, Ы,К - in Ьок, х\ ~ in X,,..., х'м = 1пл'л|.
Затем выполняют все операции множественного лилейного регрессионного анализа.
Примером внутреннелинейных форм уравнений мож-:о привести следующие: