Главная » Microsoft SQL Server, Базы данных » Интеграция OLAP

0

Раскрытие данных в качестве входных данных может использовать куб, а не реляционные таблицы (см. первую страницу мастера раскрытия данных). В этом случае режим работы, в отличие от режима работы реляционных данных, имеет несколько существенных отличий.

?               Несмотря на то что таблицы могут включаться из множества разных источников данных, куб и структура раскрытия, которая на него ссылается, должны быть определены в одном и том же проекте.

?               Если таблица определена с помощью одного измерения и связанными с ним группами мер, при необходимости использования дополнительных атрибутов раскрытия данных добавляйте их с помощью вложенных таблиц.

?               При выборе ключей структуры раскрытия для реляционной таблицы обычно выбирают первичный ключ. Старайтесь выбирать ключи структуры раскрытия из как можно более высокого уровня данных измерения, обладающего наименьшей гранулярностью. Например, при формировании квартального прогноза следует в качестве ключевого атрибута времени выбирать именно квартал, а не ключевой столбец временного измерения (которым, вероятнее всего, окажется день или час).

?               Значения по умолчанию типа данных и содержимого для куба данных имеют тенденцию быть менее достоверными, так что проверяйте и по мере необходимости корректируйте параметры типа.

?               Некоторые атрибуты измерения, основанные на датах или числах, могут появиться в интерфейсе раскрытия данных с текстовым типом. Для того чтобы понять причину такого режима работы, нужно заглянуть в теорию. Дело в том, что когда создается представление, требуется определение параметра столбца Key. При необходимости может быть определен и параметр Name, в котором ключевым значениям присваиваются имена, более понятные для конечного пользователя (например, значение June 2 005 будет более понятным, чем 2 005-06-01Т0 0 : 0 0 : 0 0). В то же время раскрытие данных будет использовать данные с типом Name вместо типа Key, что в результате довольно часто приводит к появлению в структуре раскрытия неожиданных текстовых типов данных. Иногда текстовые данные хорошо справляются с работой, однако в остальных случаях (особенно это касается атрибутов типов Key Time и Key Sequence) это может сделать невозможным создание структуры раскрытия или привести к ее некорректной работе после создания.

Разрешение этой проблемы требует либо удаления из атрибута измерения параметра столбца Name, либо добавления в измерение копии столбца, в котором уже будет отсутствовать параметр Name. Если потребуется вторая копия атрибута, то его можно пометить как невидимый, чтобы не запутать конечного пользователя.

?               Фрагмент данных куба, который будет использоваться для обучения, определяется с помощью среза куба структуры раскрытия. Скорректируйте этот срез, чтобы исключить состояния, которые не стоит использовать при обучении (например, товары с перебойными поставками и будущие периоды времени). Подумайте также о резервировании части данных для выполнения оценки модели (например, обучение можно выполнять на первых восемнадцати из последних двадцати четырех месяцев, заключительные же шесть месяцев оставить для сравнения прогнозируемых и фактических значений).

?               Линейный график не может использоваться для тестовых данных куба. Таким образом, оценка модели требует либо тестирования данных на базе реляционной таблицы, либо использования некоторой стратегии, которая не полагается на представление Mining Accuracy Chart.

Использование куба в качестве источника данных раскрытия может оказаться довольно эффективным, открывая доступ к большим массивам данных в процессе обучения и тестирования и обеспечивая возможности создания измерения или даже целого куба, основанного на обучаемой модели.

Резюме

Раскрытие данных позволяет проанализировать данные намного глубже, чем это можно сделать средствами отчетности, а служба анализа рационализирует весь процесс. Несмотря на то что данные нужно предварительно подготавливать, модели раскрытия скрывают статистические и алгоритмические детали процесса, давая пользователю возможность сфокусироваться исключительно на анализе и интерпретации информации.

Кроме того, обученные модели могут использоваться в приложениях для распределения критичных ресурсов, прогнозирования трендов, идентификации сомнительных данных и множества других целей.

Источник: Нильсен, Пол. Microsoft SQL Server 2005. Библия пользователя. : Пер. с англ. — М. : ООО “И.Д. Вильямс”, 2008. — 1232 с. : ил. — Парал. тит. англ.

По теме:

  • Комментарии