Правил оценки средств для OLAP (для справки).



  Многомерное представление данных Средства должны поддерживать многомерный на концептуальном уровне взгляд на данные.
  Прозрачность Пользователь не должен знать о том, какие конкретные средства используются для хранения и обработки данных, как данные организованы и откуда они берутся.
  Доступность В этом правиле д-р Кодд особенно подчеркивает роль OLAP в качестве прослойки между гетерогенными источниками данных и представлением для конечного пользователя. Большинство продуктов обеспечивает это, но часто посредством гораздо более многочисленных этапов и пакетирования, чем хотел бы поставщик.
  Согласованная производительность Производительность практически не должна зависеть от количества измерений в запросе.
  Поддержка архитектуры клиент-сервер Средства должны работать в архитектуре клиент-сервер.
  Равноправность всех измерений Ни одно из измерений не должно быть базовым, все они должны быть равноправными (симметричными).
  Динамическая обработка разреженных матриц Неопределенные значения должны храниться и обрабатываться наиболее эффективным способом.
  Поддержка многопользовательского режима работы с данными Средства должны обеспечивать возможность работать более чем одному пользователю.
  Поддержка операций на основе различных измерений Все многомерные операции должны единообразно и согласованно применяться к любому числу любых измерений.
  Простота манипулирования данными (интуитивное манипулирование данными) Средства должны иметь максимально удобный, естественный и комфортный пользовательский интерфейс.
  Развитые средства представления данных Средства должны поддерживать различные способы визуализации (представления) данных.
  Неограниченное число измерений и уровней агрегации данных Не должно быть ограничений на число поддерживаемых измерений.

 

Информационные хранилища -предметно-ориентированный интегрированный, привязанный ко времени и неизменяемый набор данных, предназначений для поддержки принятия решения.

Витрина данных (киоск данных)- подмножество хранилища данных, которое поддерживает деятельность отдельного подразделения.

Требования к реляционной СУБД для хранилища данных:

1. Высокая производительность загрузки данных

2. Возможность обработки данных во время загрузки

3. Наличие средств управления качеством данных

4. Масштабируемость по объему

5. Масштабируемость по количеству пользователей

6. Возможность организации сети хранилищ данных

7. Наличие средств администрирования хранилища данных

8. Поддержка интегрирования анализа размерности

9. Расширенный выбор функциональных средств и запросов

 

53. Архитектура OLAP – системы.

Клиент-серверная инфраструктура позволяет разделить OLAP-систему на несколько компонентов, которые и определяют ее архитектуру. Эти компоненты можно разместить как на одном компьютере, так и распределить по нескольким машинам. Можно выделить 3 основные части: графический интерфейс пользователя, логика аналитической обработки, логика обработки данных.

Возможные архитектуры OLAP-системы:

Каждый аналитик должен работать на достаточно мощном компьютере, позволяющем хранить OLAP-систему и выполнять всю обработку локально. Каждый аналитик использует отдельную копию данных. Поэтому копии данных должны синхронизироваться.

 

 

Сервер получает и обрабатывает запросы, инициируемые различными инструментами конечных пользователей. Графический интерфейс – специально разработанная для клиента программа, подключаемый модуль, интегрированный с какой-либо программой анализа данных и создания запросов. Хранилище данных создается и обслуживается процессом программного обеспечения (ПО), независимо от OLAP-системы. Независимое ПО выполняет извлечение данных, фильтрацию и интеграцию, необходимые для преобразования операционных данных в хранилище данных.

 

В отличие от варианта 2) OLAP-система позволяет получать прямой доступ к операционным данным, преобразуя их и храня в многомерной структуре.

 

 

Применяется смешанная идеология хранилища данных и витрины данных, когда на рабочей станции конечного пользователя хранится извлечение из хранилища данных. Логика такой технологии заключается в предположении, что большинство конечных пользователей, как правило, работают с относительно небольшим подмножеством данных из хранилища данных.

 

54 OLAP.Многомерный куб: модель, преимущества и недостатки модели.

OLAP-технология – это технология комплексного динамического синтеза, анализа и консолидации больших объемов многомерных данных в целях поддержки процессов принятия решений.

DSS (Decision Support System) – человеко-машинный вычислительный комплекс, ориентированный на анализ данных и обеспечивающий получение информации, необходимой для принятия решения в сфере управления.

MOLAP (Multidimensional OLAP) – многомерная модель данных

Многомерная модель может быть двумерной (таблица), трехмерная (куб, рис….), четырех и более мерной.

Измерение — последовательность значений одного из анализируемых параметров (регион, продукт).

В ОLAP – инструментах обязательно время.

На пересечении измерений располагаются данные, количественно характеризующие анализируемые факты – меры.

+: Высокая производительность по сравнению с реляционными моделями данных и ROLAP.

-: не позволяют работать с большими хранилищами данных, и неэффективно используется внешняя память.

Многомерные модели используются, когда объем данных не более нескольких гигабайт, набор измерения стабилен и время ответа на нерегламентированные запросы являются наиболее критичным параметром.

 

55.ОLAP. Реляционная модель данных: модели, преимущества и недостатки модели.

OLAP-технология – это технология комплексного динамического синтеза, анализа и консолидации больших объемов многомерных данных в целях поддержки процессов принятия решений.

ROLAP (Relational OLAP). Системы оперативной аналитической обработки реляционных данных (ROLAP) позволяют представлять данные, хранимые в реляционной базе, в многомерной форме, обеспечивая преобразование информации в многомерную модель через промежуточный слой метаданных. В этом случае гиперкуб эмулируется СУБД на логическом уровне.

Две схемы:

o схема "звезда" (star schema);

 

 

o схема "снежинка" (snowflake schema).

 

 

ROLAP — составляющими хранилищами данных являются таблица фактов и таблица измерений.

Таблица фактов содержит сведения об объектах или событиях, совокупность которых в дальнейшем будет анализироваться. Строка таблицы фактов соответствует ячейке гиперкуба. Таблица фактов индексируется по ключу, составленному из ключей отдельных измерений. Таблица измерений содержит неизменяемые или редко изменяемые данные. В каждой таблице измерений перечислены возможные значения одного из измерений гиперкуба.

Таблица измерений содержит как минимум одно описательное поле и, как правило, целочисленное ключевое поле для однозначной идентификации члена измерений.

Достоинства ROLAP — больший объем данных по сравнению с МOLAP, внесение изменений в структуру измерений не требует физической реорганизации БД, значительно более высокий уровень защиты данных и хорошая возможность разграничения прав доступа.

Недостаток — меньшая производительность по сравнению с MOLAPом.

 


Дата добавления: 2015-12-16; просмотров: 19; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!