Моделирование в картографии - Тикунов В.C.
ISBN 5-211-03346-9
Скачать (прямая ссылка):
17* 259
не возможно также обсуждать достоинство полученных результатов на уровне их логического анализа. Например, предлагается использовать метод экспертных оценок — метод коллективного опыта (Симонов, Невяжский, 1978).
Иногда возможно не только качественно, но и количественно оценить степень надежности того или иного алгоритма моделирования. Например, при вычислении углов наклона и экспозиции склонов (см. параграф VIIL2) оказалось возможным как бы на модельной полусфере "теоретически точно" вычислять углы наклона и экспозиции склонов и сравнивать их с результатами, которые дают разработанные алгоритмы. Это позволяет подсчитывать среднеквадратиче-ские отклонения и суммы квадратов разностей между теоретически определенными углами и найденными с помощью разработанных алгоритмов и после этого выбрать лучший из них. Визуальное сравнение карт углов наклона и экспозиций склонов, созданных на основе реализации трех алгоритмов, такой выбор наилучшего алгоритма для моделирования сделать не позволяет.
На наш взгляд, возможна также методика предварительного опробования модели для получения результатов, которые известны заранее, с последующим ее применением для решения других аналогичных задач. Например, метод восстановления пропущенных данных Фишера (1957), опробованный на модельном примере (Сербенюк, 1970; Жуков, Сербенюк, Тикунов, 1980), что позволило количественно сравнить условно недостающие и восстановленные данные, в дальнейшем использовался для заполнения пропусков в динамических рядах урожайности картофеля (см. VI.3), когда проверить качество работы алгоритма уже сложно. Известны и другие пути оценки надежности моделирования (Тикунов, 19856), но мы остановимся на математическом сравнении алгоритмов (Гриффит, Тикунов, 1990).
Сравнение выполнено на примере пяти популярных в США алгоритмов (SAS..., 1985) с методом типологии, описанным в параграфе II.2. В качестве конкретного материала, на основе которого проводилось сравнение, использовались данные об урожайности сахарного тростника в Пуэрто-Рико за 20 лет (с 1959 по 1978 г.) по 73 муниципиям, опубликованные в работе (Griffith, 1983). Вначале расчеты проводились по алгоритму автора, где первым шагом расчетов является нормировка по дисперсиям. В данном эксперименте опробовались два пути: при нормировке данных и без нее, поскольку исходный материал представляет собой моноструктурный набор данных. Конечные полученные результаты оказались очень близкими.
260
В значительной степени это объясняется сравнительной однородностью дисперсии всех 20 характеристик урожайности сахарного тростника по годам. Максимальное парное отношение дисперсий достигает 5,2, для большинства других временных рядов оно не превышает 2,5. В ситуациях, когда показатели имеют существенно более отличающиеся дисперсии, использование нормировки, естественно, предпочтительнее.
Следующий шаг касался выбора мер сходства территориальных единиц (муниципий) по комплексу показателей. В примере по Пуэрто-Рико наилучшие результаты получаются при использовании евклидовых расстояний. Однако известно, что использование евклидовых расстояний предполагает расчет их в пределах ортогональной системы координат. Согласно этому требованию показатели были обработаны по методу главных компонент. Для нашего примера уже первая компонента выбирает 90,2% дисперсии всей системы нормированных показателей, и поэтому только она использовалась для вычисления ортогонализированной матрицы исходных нормированных показателей, служащих основой для расчетов евклидовых расстояний. Учитывая число муниципий (73), количество их пар, условно связываемых евклидовыми расстояниями, достигает 2628, которые в своей совокупности образуют симметричную диагональную матрицу D (см. формулу (2.26)).
Использование в расчетах временных рядов урожайности сахарного тростника по муниципиям предполагает также необходимость учета наличия в них тренда, который может быть элиминирован несколькими путями, из которых нами опробовались два. Первый заключается в вычитании значений линейной регрессии из фактических величин урожайности во временных рядах каждой муниципии. Вторая методика связана с вычитанием последующих значений из предыдущих во временных рядах. Как известно из литературы, эти две методики тесно взаимосвязаны. Их использование в нашем примере не дает более достоверно интерпретируемых результатов, и поэтому нами данный этап был исключен.
Реализация алгоритма типологии при tmSiX = 15, a tmin = 2 позволила в примере для Пуэрто-Рико получить 14 вариантов классификации, из которых с учетом коэффициентов неоднородности выбрана группировка на шесть классов (рис. 83). Первая группа включает в себя муниципии внутренних нагорий и высокоурбанизированную агломерацию Сан-Хуана, где сбор сахарного тростника невелик или вовсе отсутствует. Вторая группа включает муниципии с самым высоким уровнем производства. Третья группа состо
261
Рис. 83. Типология муниципий Пуэрто-Рико по характеру изменений сбора сахарного тростника за 1959-1978 гг. (группы объяснены в тексте)