Моделирование в картографии - Тикунов В.C.
ISBN 5-211-03346-9
Скачать (прямая ссылка):
При наличии обоснованных "весов" каждого показателя их также можно ввести в формулу нормировки. Следует заметить, что в некоторых случаях нормировка вообще не нужна, или достаточно перевести значения показателей в проценты от их суммарных величин, что встречается при использовании моноструктурной системы показателей.
Для последующего расчета евклидовых расстояний в неискаженном виде требуется использование ортогональной системы координат, строящейся на основе нормированных исходных показателей. Поэтому для целей ортогонализации и "свертки" системы показате
71
лей применяется, например, метод главных компонент, в противном случае, ведя расчеты в косоугольной системе координат, вычисляемые расстояния будут искажены (см. предыдущий параграф). Причем в случае сильно криволинейных связей рядов исходных показателей бывает целесообразно перед расчетом корреляционной матрицы использовать "объективный численный метод выравнивания и нормализации нелинейных попарно монотонных корреляционных связей" (Алексеев, 1971). Этот блок позволяет представить нормированные исходные показатели не только в линеаризованном виде, но и приводит их к нормальному распределению.
Следует заметить, что вместо евклидовых расстояний можно использовать коэффициенты корреляции (или величины, равные 1 — г, где г — разнообразные коэффициенты корреляции), показатели ассоциации или иные меры расстояний (расстояния Махаланобиса, метода потенциальных функций и др.) (Розин, 1973; Коган, Белов, Родионов, 1983; и др.). Весь набор мер различия не эквивалентен между собой, т.е. их использование может привести к различающимся результатам. Поэтому в конкретных экспериментах полезно опробовать ряд мер, но не перебирая их все, для чего следует предварительно выделить эквивалентные меры. Методика такого исследования проведена в работе (Семкин, Двойченков, 1973), что сводит количество экспериментов до минимума.
Итак, выбрав одну из мер сходства территориальных единиц, например^ евклидовы расстояния, обратимся к анализу матрицы D. Из данной матрицы выбирается наибольшее расстояние, а две территориальные единицы, которые оно связывает, становятся ядрами, вокруг которых будут образовываться однородные группы — таксоны. Эти группы формируются распределением оставшихся (п - 2) территориальных единиц между двумя ядрами по минимальности евклидовых расстояний. В этом случае обе группы будут сформированы при условии минимальности внутригрупповых различий, выражаемых суммой евклидовых расстояний между всеми входящими в группы парами единиц. Формула для подсчета суммы различий такова:
211/2
(2.27)
Л = 2, 3,4,...
» птах'
где К — число сформированных групп; P — количество ортогона-лизированных координат для расчета расстояний; п — число терри
72
ториальных единиц; *max — максимальное количество групп; Iik — индикатор (бинарный), указывающий наличие (1) или отсутствие (0) территориальной единицы i в группе JL Выражение в квадратных скобках соответствует выбранной евклидовой метрике.
На втором этапе (при формировании трех групп) алгоритм работает следующим образом. Два первых ядра остаются, а третье находится так. Каждая из (п — 2) оставшихся территориальных единиц опробуется как третье ядро, а 0г — 3) остающиеся распределяются между тремя ядрами по минимальности евклидовых расстояний. Для каждого варианта группировки подсчитывается сумма внутригрупповых различий (см. формулу (2.27)), и тот вариант, который дает наименьшую сумму, принимается в качестве окончательного для трехгруппо-вого деления, а территориальная единица, служившая ядром, фиксируется как окончательное третье ядро.
Процедура продолжается аналогично для формирования четырех, пяти, шести и т.д. однородных групп. Причем на каждом шаге определяется новое ядро и формируется новая группировка. В пределе можно получить п групп, однако для практических целей этого не требуется и устанавливается рубеж ?max, исходя из логических соображений. Аналогично количество групп, которые следует анализировать, можно ограничить и снизу (tm[n>. Получаемый ряд группировок можно анализировать на основе абсолютного и относительного коэффициентов неоднородности:
2 1 "
А, = -
Ь=1 /=1 z=l
X (xip xJp)
1/2
1Ik1Jk
1/2
(2.28)
100
Olr =
К п п
2 2 2
к=1 /*1 Z=I
^ ~~ ^min> ^min ^тах'
2 п 1/2
2 (Xip "~ Х1р) P=I 4 1
1Ik1Jk
max п п
2 2 2
к=I /=1 г-1
1/2
, (2.29)
1Ik 1Jk
2 [xip xjp)
К = ^тт> ^min ^> >•••> ^гаах 1*
73
Если в уравнении (2.29) значение tm2LX в знаменателе дроби заменить на (К+1), то можно рассчитывать коэффициенты неоднородности для последующего варианта. Для выбора окончательного варианта классификации наряду с названными коэффициентами можно использовать значения Wk (см. уравнение (2.27)) или их производные, взятые относительно величин, рассчитанных аналогичным образом по уравнению (2.29).
Резкое возрастание значений (Ак или О0 при переходе от большего числа групп территориальных единиц к меньшему свидетельствует о существенном повышении неоднородности внутри выделенных таксонов. Напротив, плавное возрастание коэффициентов — признак равномерного увеличения неоднородности. Порог, за которым следует резкое возрастание Ак (Ok), целесообразно принимать