Главная » Microsoft SQL Server, Базы данных » Раскрытие данных в службе анализа

0

Ответы на многие производственные вопросы можно получить, выполняя запросы к базе данных. Например, можно узнать, какие страницы Web-сайта являются самыми популярными и какие заказчики являются самыми активными. Другие, порой более важные, вопросы требуют более глубоких исследований, например, каковы самые распространенные пути прохождения по Web-сайту и каковы общие характеристики самых активных покупателей. Раскрытие данных позволяет получить ответы на менее очевидные вопросы.

Термин раскрытие данных (data mining) часто неверно интерпретируется. и на эту тему существует множество анекдотов. В нашей книге понятие “раскрытие данных” не связано с чем- либо, выполняемым посредством интуиции, простых запросов или статистических методов. Это алгоритмическое извлечение неочевидной информации из больших массивов данных.

Служба анализа реализует алгоритмы извлечения информации. предназначенной для нескольких категорий задач.

?               Сегментация. Извлечение элементов групп со сходными характеристиками. Например, создание профилей самых активных покупателей или выделение подозрительных значений на странице ввода данных.

?               Классификация. Разделение элементов на категории. Например, определение, какие категории покупателей откликнулись на рекламную кампанию или какие электронные сообщения с наибольшей вероятностью являются спамом.

?               Ассоциация (эту задачу также иногда называют анализом рыночного портфеля). Определение, какие элементы имеют тенденцию встречаться вместе. Например, какие Web-странипы обычно просматривают на сайте в одном сеансе или что еще обычно приобретают клиенты, купившие конкретный товар.

?               Оценка. Оценка значения. Например, оценка объема продаж в расчете на одного клиента или оценка долговечности компонента оборудования.

?               Прогнозирование. Предположение, как будет выглядеть временная последовательность в будущем. Например, предсказание, когда все доступное пространство жесткого диска будет заполнено или какой объем продаж ожидать в следующем квартале.

?               Анализ последовательности. Определение, какие элементы имеют тенденцию появляться вместе в определенном порядке. Например, каков путь среднестатистического пользователя по сайту или в каком порядке обычно покупают товары.

Эти категории помогут вам понять, каковы сферы применения раскрытия данных. Однако по мере ознакомления с данной тематикой и накопления опыта для вас откроется множество других приложений раскрытия данных.

Источник: Нильсен, Пол. Microsoft SQL Server 2005. Библия пользователя. : Пер. с англ. — М. : ООО “И.Д. Вильямс”, 2008. — 1232 с. : ил. — Парал. тит. англ.

По теме:

  • Комментарии