4. Модели данных в ГИС
4.1 Общие принципы построения моделей данных в ГИС
ГИС использует разнообразные данные об объектах, характеристиках земной поверхности, информацию о формах и связях между объектами, различные описательные сведения. Используя приемы генерализации и абстракции, необходимо свести множество данных к конечному объему, легко поддающемуся анализу и управлению.
Абстракция – отвлечение в процессе познания от несущественных сторон, свойств, связей предмета или явления с целью выделения их существенных, закономерных признаков.
Генерализация – процесс отбора и обобщения содержания при составлении географических карт.
Генерализация проявляется:
– в отборе объектов (т. е. в ограничении содержания карты необходимыми объектами и в исключении прочих);
– в продуманном упрощении контуров;
– в обобщении количественных характеристик, состоящем в укрупнении ступеней;
– в обобщении качественных характеристик, состоящем в упрощении классификаций изображаемых явлений;
– в замене отдельных объектов их собирательными обозначениями.
В существующих ГИС используются различные способы для описания реальности посредством модели данных. Модель пространственных данных – способ цифрового описания пространственных объектов, тип структуры пространственных данных. Наиболее универсальные и употребительные из них: векторное (топологическое или нетопологическое) и растровое представление.
Каждая модель более пригодна для определенных типов данных и областей применения, поэтому при необходимости решения большого числа задач следует использовать совокупность разных моделей. Модель пространственных данных должна обладать следующими основными качествами: целостность, непротиворечивость и оптимальность.
4.2. Оверлейная структура
Цифровая карта может быть организована как множество слоев. Слои построены на основе объединения (типизации) пространственных объектов, имеющих общие свойства:
– принадлежность к одному типу координатных объектов (точечные, линейные, полигональные);
– принадлежность к одному типу пространственных объектов (жилые здания, подземные коммуникации, административные границы и т. д.);
– отображение на карте одним цветом.
Принадлежность объекта или части объекта к слою позволяет использовать и добавлять групповые свойства объектам данного слоя.
Слои могут иметь как векторные, так и растровые форматы. Однако многие ГИС допускают возможность работы со слоями только векторного типа, а растр используется в качестве подложки.
Рис. 1. Послойная структура электронной карты
С помощью системы фильтров или заданных параметров объекты, принадлежащие слою, могут быть одновременно масштабированы, перемещены, скопированы, записаны в базу данных.
Многослойная организация электронной карты при наличии гибкого механизма управления слоями позволяет не только объединить и отобразить большее количество информации, чем на обычной карте, но существенно упростить анализ картографических данных с помощью селекции данных, необходимых для визуализации и механизма «прозрачности» цифровой карты.
Рис. 2. Различные виды выборок
Над объектами, расположенными на разных слоях, можно проводить оверлейные операции. Оверлейными операциями называется процесс генерации новых и изменения существующих объектов путем наложения (совмещения) различных цифровых карт, содержащих разнотипные объекты, при этом созданные или модифицированные объекты могут иметь информацию, являющуюся производной от информации исходных объектов. Например, если имеются два полигональных объекта, которые частично пересекаются, то над ними могут быть осуществлены операции объединения, пересечения и т. п.
Рис. 3. Оверлейные операции
4.3. Базовые типы пространственных объектов
Объектом информационного моделирования в ГИС является пространственный объект. Это одно из ключевых понятий геоинформатики. Он может быть определен как цифровое представление (модель) объекта реальности (местности), содержащее его местоуказание и набор свойств (характеристик, атрибутов).
Базовыми (элементарными) типами пространственных объектов, которыми оперируют современные ГИС, обычно считаются следующие (в скобках приведены их синонимы):
– точка (точечный объект) – 0-мерный объект, характеризуемый плановыми координатами;
– линия (линейный объект, полилиния) – 1-мерный объект, образованный последовательностью не менее двух точек с известными плановыми координатами (линейными сегментами или дугами);
– полигон (область, контур) – 2-мерный (площадной) объект, внутренняя область, ограниченная замкнутой последовательностью линий (дуг в векторных топологических моделях данных или сегментов в нетопологической модели) и идентифицируемая внутренней меткой;
– пиксел (пиксель) – 2-мерный объект, наименьший элемент, получаемый в результате дискретизации изображения (разбиения на далее неделимые элементы растра);
– ячейка (регулярная ячейка) – 2-мерный объект, элемент разбиения земной поверхности линиями регулярной сети;
Общее цифровое описание пространственного объекта включает:
– наименование;
– указание местоположения;
– набор свойств;
– отношения с иными объектами.
Наименованием объекта служит его географическое наименование, его условный код и/или идентификатор, присваиваемый пользователем или назначаемый системой.
В зависимости от типа объекта его местоположение определяется парой (триплетом) координат (для точечного объекта) или набором координат, организованным определенным образом в рамках некоторой модели данных. Перечень свойств соответствует атрибутам объекта, качественным и количественным его характеристикам. Атрибуту объекта могут быть поставлены в соответствие любые типы данных: текст, видео- или аудиозапись, графика (включая карту), что реализуется на практике в мультимедийных электронных атласах.
Под отношениями понимают прежде всего топологические отношения (топологию). К топологическим свойствам пространственного объекта принято относить его размерность, замкнутость, связность, простоту (отсутствие самопересечения линейных объектов и «островов» в полигоне) и т. п. Примерами топологических отношений объектов являются их свойства «пересекаться», «касаться», «быть внутри», «содержать», «совпадать».
4.4. Растровая модель данных
Растр – прямоугольная решетка – разбивает изображение на составные однородные далее неделимые части, называемые пикселами, каждому из которых поставлен в соответствие некоторый код, обычно идентифицирующий цвет в той или иной системе цветов (цветовой модели).
Растровая модель данных:
– разбивает всю изучаемую территорию на элементы регулярной сетки;
– каждая ячейка содержит только одно значение;
– является пространственно заполненной, поскольку каждое местоположение на изучаемой территории соответствует ячейке растра.
Рис. 4. Образование растровой структуры.
Исходные полигональные объекты (слева) с атрибутами (классами) А, В, С, D и Е и матрица размерностью 7x7 растровой модели (справа), каждому элементу которой присвоено значение атрибута объекта
Выбрав подходящий размер пиксела растровой модели, можно добиться пространственного разрешения (количества пикселов в единице длины, обычно дюйм или сантиметр), удовлетворяющего целям их цифрового описания и последующей обработки. Чем больше разрешение, тем качественнее выглядит изображение и тем больше степень возможного его увеличения. Векторные изображения не имеют подобной характеристики и всегда выглядят четко.
Рис. 5. Сравнение качества изображения в векторной и растровой моделях при различном масштабе
Двукратное увеличение разрешения ведет к четырехкратному росту объемов хранимых данных и т. д., поэтому необходимо найти баланс между качеством изображения и размером файла.
В растровых ГИС аналитические операции сводятся к попиксельным операциям с набором растровых слоев и могут быть легко «распараллелены».
Поддержка растровой модели данных – хорошая предпосылка (и условие) интеграции программных продуктов ГИС со средствами цифровой обработки данных дистанционного зондирования и обработки изображений в целом.
Растровые модели имеют следующие достоинства:
– растр не требует предварительного знакомства с явлениями;
– данные собираются с равномерно расположенной сети точек, что позволяет в дальнейшем на основе статистических методов обработки получать объективные характеристики исследуемых объектов;
– растровые данные проще для обработки по параллельным алгоритмам;
– некоторые задачи, например создание буферной зоны, проще решать в растровом виде;
– многие растровые модели позволяют вводить векторные данные, в то время как обратная процедура весьма затруднительна для векторных моделей;
– процессы растеризации много проще алгоритмически, чем процессы векторизации, которые зачастую требуют экспертных решений.
Простота машинной реализации операций с растровыми данными находится в противоречии с другой главной их особенностью – значительными затратами памяти, требуемой для их хранения (в сравнении с векторными моделями). Существуют способы сжатия (компрессии) растровых данных.
Недостаток растровых форматов состоит в сложности распознавания объектов. Растр применяется в основном там, где пользователей не интересуют отдельные пространственные объекты, а интересует точка пространства как таковая с ее характеристиками (высотная отметка или глубина, влажность или тип почв и т. п.). Наиболее часто растровые модели применяют при обработке аэрокосмических снимков.
Если атомарной единицей данных при их описании служит элемент «разбиения» территории не прямоугольной (квадратной), а другой правильной геометрической формы – речь идет о другой, отличной от растровой, хотя и формально с нею схожей, регулярно-ячеистой модели данных. Известны примеры регулярных сетей (решеток) с ячейками правильной треугольной, гексагональной или трапециевидной формы.
Рис. 6. Регулярная треугольная решетка
Рис. 7. Сеть равновеликих трапеций на сфере
4.5. Квадротомическая модель
Главный мотив использования и поддержки данной модели программными средствами ГИС – компактность хранения данных по сравнению с растровой моделью.
В основе квадротомического дерева лежит разбиение изображения на вложенные друг в друга квадратные участки, каждый из которых делится рекурсивно на четыре вложенных до достижения некоторого уровня пространственного разрешения.
Рис. 8. Механизм построения квадродерева участка территории с пятью областями
На первом этапе деления исходного участка на четыре квадратных блока и одновременном «ветвлении» квадродерева образуется один неделимый далее элемент № 1 (ему соответствует «лист» дерева на рис. 8 справа) и три «узла» делимых далее квадратов первого уровня иерархии (принимая «корневой» уровень квадратного участка в целом за нулевой). За исключением девяти гомогенных квадратов, на втором иерархическом уровне все остальные элементы делятся далее, пока необходимость дальнейшего деления не будет исчерпана на последнем, четвертом, этапе.
Экономия в сравнении с растровой моделью данных очевидна – область Е на рис. 8. оказалась представленной одним квадратом под номером 33 (а не 16 элементами растра или ячеек регулярной сети), и ее цифровое описание подразумевает лишь формализованное представление структуры квадродерева.
Принимая за нулевой уровень иерархии земную сферу в целом, можно построить глобальное квадротомическое дерево. Уже на 23-м уровне иерархии достигается метровое его разрешение.
4.6. Векторные модели
Векторные модели данных строятся на базе векторов, занимающих часть пространства в отличие от занимающих все пространство растровых моделей. Это определяет их основное преимущество – требование меньшей памяти для хранения и меньших затрат времени на обработку и представление.
Таблица 1
Краткое сравнение преимуществ растровой и векторной моделей
В транспортных, инженерных, коммунальных ГИС практически всегда используют векторные модели данных.
При построении ГИС применяют набор базовых геометрических данных, из которых затем компонуют остальные, более сложные данные. В ГИС используются следующие типы атомарных геометрических данных.
Безразмерные (0-мерные) типы объектов:
– точка – определяет геометрическое положение;
– узел – топологический переход или конечная точка, также может определять местоположение.
Одномерные типы объектов:
– линия;
– линейный сегмент – прямая линия между двумя точками;
– строка – последовательность линейных сегментов;
– дуга – геометрическое место точек, которые формируют кривую, определенную математической функцией;
– связь – соединение между двумя узлами;
– направленная связь – связь с одним определенным направлением;
– цепочка – направленная последовательность непересекающихся линейных сегментов или дуг с узлами на их концах;
– кольцо – последовательность непересекающихся цепочек, строк, связей или замкнутых дуг.
Двумерные типы объектов:
– полигон (область) – ограниченный непрерывный объект, который может включать или не включать в себя собственную границу.
Трехмерные типы объектов:
– тело – объемный объект, описываемый триплетом координат, включая аппликату Z, и ограниченный поверхностями.
4.6.1. Нетопологическая модель
Множество точечных объектов, образующее слой однородных данных (например, множество объектов, соответствующих населенным пунктам), может быть представлено в векторном формате в виде неупорядоченной (не обязательно упорядоченной) последовательности записей (строк таблицы). Каждая из записей содержит три числа: уникальный идентификационный номер объекта (идентификатор), значения координат X и Y в системе плановых прямоугольных декартовых координат:
Линейный объект или граница полигонального объекта могут быть представлены в виде последовательности образующих их точек (промежуточных точек), т. е. набором линейных отрезков прямых (сегментов), образующих полилинию. При этом каждый именованный полигон (со своим идентификатором) представляется записью пар координат, образующих его границу в избранной последовательности (например, по часовой стрелке). При описании множества полигонов каждый отрезок границы, заключенный между двумя узловыми точками (за исключением внешней границы полигонов), будет описан дважды (по часовой стрелке и против).
Рис. 9. Описание полигонов в рамках векторной нетопологической модели
При этом границы смежных полигонов могут не совпадать, что может привести к ошибкам в различных расчетах (математических и логических).
Рис. 10. Несовпадение границ полигонов при их независимом описании в рамках векторной нетопологической модели
Такая нетопологическая модель данных для описания точечных, линейных и полигональных объектов носит наименование модели «спагетти». Она не является эффективной с точки зрения неизбыточности хранимых данных и возможностей использования аналитических операций и поддерживается программными средствами настольного картографирования.
4.6.2. Топологическая модель
В нетопологических ГИС цифруются пространственные объекты, изначально не знающие друг о друге, и построение отношений между ними осуществляется в режиме постпроцесса. В топологических же ГИС фиксация топологических пространственных отношений между объектами (смежности, связности, вложенности и др.) является основой их конструкции. Топологические системы являются более адекватным инструментом для создания цифровых карт, на основе которых можно производить различные аналитические и статистические операции. Топологические модели позволяют представить всю карту в виде графа. Площади, линии и точки описываются с помощью узлов и дуг. Каждая дуга идет от начального к конечному узлу. Известно, что находится справа и слева.
Векторная топологическая модель обязана своим происхождением задаче описания полигональных объектов. Ее называют еще линейно-узловой моделью. С ней связаны и особые термины, отражающие ее структуру. Главные ее элементы (примитивы):
– узел;
– дуга;
– сегмент (линейный сегмент, отрезок (прямой);
– полигон (область, полигональный объект, многоугольник, контурный объект), в том числе:
– простой полигон;
– внутренний полигон («остров», анклав);
– составной полигон;
– универсальный полигон (внешняя область).
Рис. 11. Примитивы линейно-узловой модели
Для каждого узла у линейных объектов существует характеристика – валентность. Валентность узла – это количество смежных узлу дуг. Концы обособленных линий одновалентны. Для уличных сетей (пересечение улиц) валентность чаще всего равна четырем. В гидрографии чаще встречаются трехвалентные узлы (основное русло реки и приток).
Описание полигона в векторной топологической модели – это множество трех типов элементов: узлов, дуг и собственно полигонов. Между этими объектами устанавливаются топологические отношения, необходимым элементом которых должна быть связь дуг и узлов, полигонов и дуг. Последним приписываются указатели разграничиваемых ею правого и левого полигонов, конвенциализирущие направление обхода контуров.
Рис. 12. Направление при описании полигонов в рамках векторной топологической модели
Рис. 13. Структура узлов, дуг и полигонов в векторной нетопологической модели.
1, 2, 3, 6, 8, 10, 11, 12, 13 – узлы; 4, 5, 7, 9, 14, 15 – промежуточные точки линейных сегментов (дуг); (1–2), (2–3), (3–6), (6–8), (8–1), (10–11), (11–8), (3–12), (12–10) – дуги; А, В, С – полигоны; D – внутренний полигон («остров», анклав), для описания которого вводится фиктивный узел (псевдоузел) (16), Е – внешний (по отношению ко всем полигонам в пределах прямоугольного участка координатной плоскости) полигон.
Когда атрибутивные данные управляются средствами реляционной СУБД и организованы в таблицы, связь между позиционной и атрибутивной составляющей устанавливается и поддерживается через идентификатор объекта.
Рис. 14. Связь между позиционными и атрибутивными данными в векторной топологической модели
Необходимая процедура при работе с топологическими данными – подготовка геометрических данных. Этот процесс трудно автоматизировать: топологические характеристики должны быть вычислены заранее и занесены в базу данных вместе с координатными данными.
4.6.3. Сетевые модели
В практике проектирования ГИС нередки случаи, когда ни одна из «классических» моделей не может удовлетворить особым требованиям пользователей к системе и все они оказываются малоэффективными или непригодными для решения специфических классов задач, например сетевой анализ для решения задач оптимизации перевозок, планирования маршрутов или диспетчеризации мобильных транспортных средств. При моделировании сети транспортных коммуникаций в рамках классической векторной модели пространственная организация дороги (в том числе автодороги, с мостами, путепроводами, туннелями и многоуровневыми развязками) не может быть представлена планарным графом, и все подобные случаи нарушения планарности будут квалифицироваться системой как топологическая ошибка в цифровой записи линейных объектов.
Конец ознакомительного фрагмента.