Моделирование в картографии - Тикунов В.C.
ISBN 5-211-03346-9
Скачать (прямая ссылка):
Основное уравнение метода главных компонент можно записать в виде
где Xj — исходные показатели; Z1 — главные компоненты; cojt — вес /-го показателя в z-й компоненте. С точки зрения матричной алгебры главные компоненты являются собственными векторами корреляционной матрицы. Решив уравнение IR - AI I =0, где I — единичная матрица, получаем т действительных положительных корней Я. Каждому корню (собственному числу) соответствует собственный вектор. Наибольший корень является дисперсией первой главной компоненты.
Корреляционная матрица R подвергается диагонализации так, что
где U — ортогональная матрица, полученная из R; U' — транспонированная матрица U; L — диагональная матрица, состоящая из собственных чисел X матрицы R. Коэффициенты корреляции между
т
(2.19)
R = ULU
(2.20)
66
показателями (х) и главными компонентами (z) образуют матрицу W = UL1/2:
W = UL1/2:
ч 22 z3 • zm »п »12 »13 . . . »1т~ X1 »21 »22 »23 . »2т »31 »32 »33 • • • »3т »ml »т2 »тз ? • • ^тт хт (2.21)
Сумма квадратов элементов строки матрицы есть дисперсия данного показателя, которая равна единице. Если складывать квадраты чисел по столбцам, то получим дисперсии главных компонент (собственные числа), т.е.
»11
"12 »13
»Il
»22 »23
»31 +
»32 + 1 +
"зз
+ + +
"ml = А1 "т2 = А2 "тЗ - ^3
(2.22)
"lm + "2т + "L + • • • + "mm = Хт
Из данного выражения видно, что X1 представляют собой оценку
силы линейной связи между z и вектором исследуемых показателей (х).
В практике географических исследований, как правило, используют главные компоненты с большими дисперсиями. Компоненты, имеющие малые дисперсии, отбрасываются. Например, если различия между географическими объектами сводятся к двум линейным комбинациям, то исследователь может изучать именно эти две величины. Другие линейные комбинации отбрасываются, так как они мало изменяются от одного объекта к другому и, следовательно, дают мало информации о различиях между объектами. Таким образом, метод главных компонент позволяет сократить число случайных величин без существенной потери информации об изменчивости. Однако, чтобы учесть полную дисперсию показателей, необходимо учитывать все т компонент. Это видно из основного уравнения метода главных компонент, не содержащего остаточной составляющей еу, как это имеет место в факторной модели.
Поскольку метод главных компонент связан с суммарной дисперсией показателей, то он наиболее эффективен, когда все показатели измеряются в одних единицах. Поэтому обычно показатели выража-
5*
67
ют в стандартной форме — нормируют, о чем будет идти речь в дальнейшем. Метод главных компонент можно применять без ограничений к функции распределения анализируемых показателей. В данном методе нет необходимости делать какие-либо предположения о показателях. Они не обязаны быть случайными величинами, хотя их часто рассматривают как выборку из генеральной, нормально распределенной совокупности (Налимов, 1971). Подробное изложение алгоритмов и программ компонентного анализа можно найти в целом ряде работ (Сербенюк, 1972; Максимов, 1972; Рахлина, 1973; Жуков, Сербенюк, Тикунов, 1980; и др.).
Для целей картографирования результатов факторного или компонентного анализа необходимо вычисление значений факторов по каждой из территориальных единиц. Известны различные методы расчетов. Среди них наиболее прост и часто используется в географических исследованиях метод, который сводится к следующему выражению показателей:
F = XL, (2.23)
где X — матрица, столбцы которой представляют исходные показатели; L — матрица, отражающая факторные (компонентные) нагрузки; F — искомая матрица, столбцы которой соответствуют факторам (компонентам), выраженным через исходные показатели.
В этом уравнении факторы (компоненты) определяются как взвешенные суммы исходных показателей, значения которых предварительно нормируются. Используя характеристики величин исходных показателей и их нагрузок на каждый из факторов или компонент (аналогично удельным весам), определяется значение факторов (компонент) по каждой из территориальных единиц. Картографирование данных характеристик позволяет создавать разнообразные тематические карты.
Однако ряд ученых считает, что результаты моделирования очень часто оказываются сложно интерпретируемы, даже при использовании вращения факторов, влияющего на конечные результаты. Определенное влияние оказывает субъективизм в выборе градаций для группировки территориальных единиц в таксоны на основе матрицы F (Праги, 1978; Johnston, 1977). Г.Т. Максимов считает, "что ни один из этих методов (факторный, компонентный и др.) не дает готовой типологии. Другими словами, результат многомерного анализа является только руководством при группировке, а не ответом. Выделение конкретных классов зависит от эрудиции и искусства исследователя" (Максимов, 1972, с 60). В связи с этим, на наш
68
взгляд, эффективнее использовать факторный и компонентный анализы не как самостоятельные методы, а как части более сложных моделей, описанных в последующих двух параграфах.