Базовые структуры данных в ГИС.



Геоинформационные данные содержат четыре интегрированных компонента:

1)географическое положение (разграничение) пространственных объектов представляется 2-х, 3-х и 4-х мерными координатами в географически соотнесенной системе координат (широта/долгота)

2)атрибуты – свойства, качественные или количественные признаки, характеризующие пространственный объект (но не связанные с его местоуказанием)

3)пространственные отношения определяют внутренние взаимоотношения между пространственными объектами;

4)временные характеристики представляются в виде сроков получения данных, они определяют их жизненный цикл, перемену местоположения или свойств пространственных объектов во времени.

Основополагающие элементы базы пространственных данных

Элементы действительности, смоделированные в базе данных ГИС имеют 2 тождества: реальный объект и смоделированный объект (объект БД).

Реальный объект – явление окружающего мира, представляющее интерес, которое не может быть более подразделено на явления того же самого типа.

Объект БД – является в том виде, в каком он представляется в БД. Объект БД является цифровым представлением целого или части реального объекта.

Метод цифрового представления явления применяется, исходя из базового масштаба и ряда других факторов.

Модель базы пространственных данных

Каждый тип реального объекта представляется определенными пространственными объектами базы данных. Пространственные объекты могут быть сгруппированы в слои. Один слой может представлять одиночный тип объекта или группу связанных типов.

Представление пространственных данных

Представление пространственных данных – это способ цифрового описания пространственных объектов.

Наиболее универсальные и употребительные из них: 1) векторное представление (точки, линии, полигоны); 2) растравое представление (ячейки, стеки).

Существуют способы перехода от одного представления пространственных данных к другому.

Растровая модель данных

Растровая модель данных – цифровое представление пространственных объектов в виде совокупности точек растра (пикселей) с присвоеными им значениями объекта. РМ предполагает позиционирование объектов указанием их положения в соответствующий растру прямоугольной матрице единообразной для всех типов пространственных объектов (точек, пикселей, полигонов и поверхностей).

Разбивает всю изучаемую территорию на элементы сетки или ячейки. Каждая ячейка содержит только одно значение. РМ оперирует элементарными местоположениями.

Соглашения, принимаемые для растровой ГИС:

1)Разрешение

В РМ наименьшей единицей для большинства системы выступает квадрат или прямоугольник. Такой единицей (сетка, ячейка, пиксель). Множество ячеек образует решетку, растр, матрицу.

2)Местоположение

Наименьшая единица географического пространства, для которого могут быть приведены какие-либо характеристики или свойства (пиксель/ячейка). Такая частица плана однозначно идентифицирует упорядоченный парой координат положение строки и столбца.

Информационные хранилища.

Хранилище данных – предметно-ориентированная, интегрированная, содержащая данные, накопленные за большой интервал времени, автоматизированная система, предназначенная для поддержки принятия управленческих решений.

Построение хранилищ данных для интеграции неоднородных источников данных принципиально отличается от построения БД.

2. Свойства информационных хранилищ

Уильям Инман, считающийся основателем нового направления развития технологии БД дал классическое определение информационного хранилища в 1990 году. Он охарактеризовал его как специальным образом администрируемую базу данных, содержимое которой имеет следующие свойства:

1) предметная ориентация (в отличие от БД в традиционных OLTP-системах, где данные подобраны в соответствие с конкретными приложениями, информация в ИХ ориентирована на задачи поддержки принятия решений. Для системы поддержки принятия решений требуются источники);

2) интегрированность данных (данные в ИХ поступают из различных источников, где они могут иметь различные типы, атрибуты, единичные измерения и способы кодирования. После загрузки в ИХ данные очищаются от индивидуальных признаков, то есть как бы приводятся к общему знаменателю);

3) инвариантность во времени (В OLTP-системах истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием ИХ от БД является то, что данные в них сохраняются свою истинность в любой момент процесса чтения);

4) неразрушимость - стабильность информации (В OLTP-системах записи могут регулярно добавляться, удаляться и редактироваться. В ИХ как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ));

5) минимализация избыточности информации;

3. Основные компоненты ИХ

1) ПО промежуточного слоя

Обеспечивает сетевой доступ и доступ к БД. Сюда относятся сетевые и коммуникационные протоколы, драйверы, системы обмена сообщениями и пр.

2) Транзакционные БД и внешние источники информации

Базы данных OLTP-систем

3) Уровень доступа к данным

Относящееся сюда ПО обеспечивает общение конечных пользователей с ИХ и загрузку требуемых данных из транзакционных систем. В настоящее время универсальным языком общения служит язык структурированных запросов (SQL)

4) Загрузка и предварительная обработка

Этот уровень включает в себя набор средств для загрузки данных из OLTP-систем и внешних источников. Выполняется, как правило, в сочетании с дополнительной обработкой: проверку данных на чистоты, консолидация, форматированием, фильтрацией и пр.

5) Информационное хранилище

Представляет собой ядро всей системы – один или несколько серверов БД

6) Метаданные

Метаданные (репозиторий “данных о данных”). Играют роль справочника, содержащего сведения об источних первичных данных, алгоритмах обработки, которым исходные данные подверглись и т.п.

7) Уровень информационного доступа

Обеспечивает непосредственное общение пользователя с данными посредством стандартных систем манипулирования, анализа и предоставления данных типа MS Exel, MS Access, Lotus Notes и др.

8) Уровень управления (администрирования)

Отслеживает выполнение процедур, необходимых для обновления информационного хранилища или поддержания его состояния. Здесь программируются процедуры подкачки данных, перестройки индексов, выполнение итоговых расчетов, репликации данных, построение отчетов, формирование сообщений пользователей, контроля целостности и др.

Технология обработки данных.

Обработка данных (англ. «Data processing») – это процесс

последовательного управления данными (числа и символы) и преобразования

их в информацию.

Обработка данных может осуществляться в интерактивном и фоновом

режимах. Напомним, что под данными понимают сведения, представленные

в определѐнной знаковой системе, а информация – это данные,

сопровождающиеся смысловой нагрузкой, помещѐнные в некоторый

контекст; данные, как-либо оцениваемые приѐмником информации. Как

правило, получение информации связывают с уменьшением

неопределенности существующего выбора; ответ на какой-либо заданный

или подразумеваемый вопрос. Причѐм для одних личностей (или с одной

точки зрения) данные вполне могут быть информацией.

Технология обработки информации – это упорядоченная

последовательность взаимосвязанных действий, выполняемых в строго

определѐнной последовательности с момента возникновения информации до

получения заданных результатов.

Обработка информации представляет собой переработку информации

определѐнного типа (текстовый, звуковой, графический и др.) и

преобразования еѐ в информацию другого типа. Например, различают

обработку текстовой информации, изображений (графики, фото, видео и

мультипликация), звуковой информации (речь, музыка, другие звуковые

сигналы). Использование новейших технологий обеспечивает их

комплексное представление. При этом человеческое мышление может

рассматриваться как процесс обработки информации. В библиотеках методы

и процессы, связанные с обработкой поступающих в них документов с целью

создания их описаний (метаданных) получили название научная обработка

литературы. 

Информационная технология обработки предназначена для решения

хорошо структурированных задач, по которым имеются необходимые

входные данные, известны алгоритмы и другие стандартные процедуры их

обработки. Эта технология применяется в целях автоматизации рутинных

постоянно повторяющихся операций, что позволяет повышать

производительность труда, освобождая исполнителей от рутинных операций,

 а порой и сокращая численность работников. При этом решаются задачи:

обработки данных; создания периодических отчѐтов о состоянии дел;

связанные с получением ответов на различные текущие запросы и

оформлением их в виде документов или отчѐтов.

При обработке применяют такие информационные технологии, как:

● сбор и регистрация данных непосредственно в процессе

производства в форме документа с использованием центральной ЭВМ или

персональных компьютеров;

● обработка данных в режиме диалога;

● агрегирование (объединение) данных;

● использование электронных носителей информации


Дата добавления: 2018-04-15; просмотров: 469; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!