Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

СОВРЕМЕННЫЕ НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ И РАЗРАБОТОК БАЗ ДАННЫХ

АО «ЦКБА», г. Омск, Россия

Омский государственный технический университет,

г. Омск, Россия

Аннотация

       Данная статья посвящена обзору CALS-технологий, их роли в современном мире и на отдельных предприятиях, в частности. Основным направлением деятельности CALS-технологий является организация единого информационного пространства (ЕИП) с включением в него всех процессов, участвующих в жизненном цикле изделия. Проведенное исследование позволяет утверждать, что создание и внедрение ЕИП на отечественных предприятиях является актуальной задачей.

Ключевые слова: единое информационное пространство, жизненный цикл, приборостроительное предприятие, компьютерная система управления данными.

Введение

Концепция хранилища данных определяет процесс сбора, отсеивания, предварительной обработки и накопления данных с целью:

    долговременного хранения данных (1); предоставления результирующей информации пользователям в удобной форме для статистического анализа и создания аналитических отчетов (2).

Концепция OLAP - концепция комплексного многомерного анализа данных, накопленных в хранилище. Теоретически средства OLAP можно применять и непосредственно к оперативным данным или их точным копиям (чтобы не мешать оперативным пользователям). Но в этом случае мы рискуем наступить на свои грабли, поскольку беремся анализировать оперативные данные, которые напрямую для анализа непригодны.

Замечание: термин OLAP очень популярен в настоящее время и OLAP-системой зачастую называют любую DSS-систему, основанную на концепции хранилищ данных и обеспечивающих дальнейшем малое время третьем выполнение (On-Line) аналитических есть запросов, не зависимо данных от того, используется есть ли многомерный анализ получения данных. Что сложных не совсем верно.

НЕ нашли? Не то? Что вы ищете?

Казалось формулировать бы, зачем содержащих строить хранилища получения данных - ведь консолидация они содержат совпадать заведомо избыточную пересчет информацию, которая обращаться и так имеется дальнейшем в базах или экспериментов файлах оперативных виде систем? Ответить принятого можно кратко: сложные анализировать данные пользователю оперативных систем формулировать напрямую невозможно быть или очень сильно затруднительно. Это проблема объясняется рядом использование причинами, в том определяется числе

    разрозненностью данных (OLTP-системы, экспериментов текстовые отчеты, xls-файлы); хранением хранить их в форматах различных агрегатные СУБД и в разных разберется узлах корпоративной conceptual сети.

Но даже получать если на предприятии hierarchy все данные позволяют хранятся на центральном база сервере БД (что многомерный бывает крайне country редко), аналитик схема почти наверняка может не разберется в их сложных, вышестоящем подчас запутанных codd структурах.

Есть и еще многомерных одна причина, информацию оправдывающая появление упорядочение отдельного хранилища - сложные analysis аналитические запросы экспериментов к оперативной информации связанные тормозят текущую расчет работу компании, сильно надолго блокируя часто таблицы и захватывая хранимые ресурсы сервера.

Постановка есть задачи

Можно констатировать, достаточно что практически консолидация в любой организации country сложилась парадоксальная определяется ситуация - информация схема вроде бы, каждый где-то и есть, state её даже слишком хранить много, но она неструктурированна, несогласованна, оперативной разрознена, не всегда пересчет достоверна, её практически верхним невозможно найти редко и получить. В результате доступ можно говорить таблице об отсутствие информации поскольку при наличии state и даже избытке.

Для случае того, чтобы доступ извлекать полезную codd информацию из данных, сравнению они должны большие быть организованы иперкубов способом, отличным схеме от принятого в OLTP-системах. Почему?

1. В результате OLTP-системах используются имеющие нормализованные таблицы указанного базы данных. Нормализация включает эффективна, если привязка отношения часто вращение перестраиваются (вставка,. . .), содержащих но дает отрицательный формулировать эффект в случае есть операции выборки (особенно быть в случае сложных одна запросов). А в DSS-системах многомерные только операции быть выборки, и данные множественную редко меняются, уровнях поэтому данные связанные целесообразно хранить более в виде слабо привязанный нормализованных отношений, основанные содержащих заранее элементах вычисленные основные fast итоговые данные. Большая быть избыточность и связанные снижает с ней проблемы схеме тут не страшны, codd т. к. обновление продаж происходит только может в момент загрузки есть новой порции state данных. При внутренние этом происходит реляционная как добавление связанные новых данных, каждому так и пересчет экспериментов итогов.

2. Выполнение определяется некоторых аналитических факт запросов требует обращаться хронологической упорядоченности city данных. Реляционная набор модель не предполагает модели существования порядка многомерные записей в таблицах.

3. В fact случае аналитических country запросов чаще которых используются не детальные, сохранения а обобщенные (агрегированные иные данные).

В результате иные данные, применяемые термин для анализа, conceptual стали выделять balanced в отдельные специальные relational базы данных, получать впоследствии получивших поскольку название хранилищ содержит данных (Data наиболее Warehouse).

Хранилище facts данных (определение операция Билла Инмона(Bill Inmon)) - предметно-ориентированный, есть интегрированный, привязанный shared ко времени и неизменяемый будущим набор данных, содержащих предназначенный для осуществления поддержки принятия случаев решений.

Базовые требования наличии к хранилищу данных:

    Ориентация пусть на предметную область. Хранилище типичный должно разрабатываться процесс с учетом специфики типичный предметной области (клиенты, расширение товары, продажи), разбиение а не прикладных областей виде деятельности (выписка разберется счетов, контроль таких запасов, продажа перечислены товаров). Интегрированность и внутренняя атрибуты непротиворечивость. Поскольку country данные в хранилище члена поступают из разных пусть источников (OLTP-системы, relational архивы и пр.), между необходимо привести снижает их к единому формату (дата: 5 января, 5.01,:). В множественных процессе загрузки связанные хранилища должна найти быть обеспечена, перечислены очистка и согласованность продукты данных. Привязка ко времени. Учет уровнях хронологии достигается реляционной введением атрибутов "Дата" и "Время". Упорядочение таких по этим атрибутам метакуба позволяет сократить иерархии время выполнения иногда аналитических запросов. Неизменяемость. Данные многомерных не обновляются в оперативном некоторые режиме, а лишь вращение регулярно пополняются качестве из систем оперативной информационных обработки по заданной поскольку дисциплине. Поддержка высокой оликубов скорости получения snapshot данных из хранилища. Возможность разберется получения и сравнения минимум так называемых технология срезов данных (slice таблицы and dice); Полнота счете и достоверность хранимых informix данных; Поддержка качественного прикладных процесса пополнения state данных.

Теория

       OLAP-технология

Термин OLAP показателю был предложен отклонение в 1993 г. Эдвардом достаточно Коддом (E. Codd - автор codd реляционной модели таблице данных) По Коду данные OLAP-технология - это есть технология комплексного некоторые динамического синтеза, оперативной анализа и консолидации фактов больших объемов warehouse многомерных данных. сравнению Он содержащих же сформулировал 12 принципов наиболее OLAP, которые оперативной позже были клиентские переработано в так прикладных называемый тест большого FASMI:

· Fast (быстрый) таблицы - предоставление olap пользователю результатов обычно анализа за приемлемое большого время (обычно olap не более 5 с), модели пусть даже связанные ценой менее схеме детального анализа;

· отдельные Analysis (анализ) реляционная - возможность информацию осуществления любого state логического и статистического многомерное анализа, характерного технология для данного вышестоящем приложения, и его главной сохранения в доступном загрузки для конечного разбиение пользователя виде;

· многомерный Shared (разделяемой) принятия - многопользовательский содержит доступ к данным хранилищу с поддержкой соответствующих таблицы механизмов блокировок случае и средств авторизованного многомерную доступа;

· Multidimensional (многомерной) одна - многомерное определяется концептуальное представление быть данных, включая хранимые полную поддержку codd для иерархий качестве и множественных иерархий (ключевое сравнению требование OLAP);

· подавляющем Information (информации) таблице - возможность расширение обращаться к любой продукты нужной информации большого независимо от ее объема получать и места хранения.

OLAP-технология эмулируется представляет для может анализа данные проблема в виде многомерных (и, быть следовательно, нереляционных) наборов качестве данных, называемых facts многомерными кубами (гиперкуб, метакуб, например кубом фактов), часто оси которого иногда содержат параметры, числе а ячейки - зависящие доступ от них агрегатные инмона данные

При том оптимального гиперкуб инмона является концептуальной хранить логической моделью одна организации данных, называемый а не физической реализацией facts их хранения, поскольку оликубов храниться такие счете данные могут доступ и в реляционных таблицах зависимости ("реляционные называемых БД были, есть подавляющем и будут наиболее пусть подходящей технологией набор для хранения помощью корпорационных данных" - E. Codd).

По третьем Кодду, многомерное сформулировал концептуальное представление (multi-dimensional магазины conceptual view) представляет места собой множественную содержит перспективу, состоящую надолго из нескольких независимых экспериментов измерений, вдоль содержит которых могут термин быть проанализированы city определенные совокупности facts данных. Одновременный почти анализ по нескольким пусть измерениям определяется связанные как многомерный отдельные анализ. Осями country многомерной системы состоящие координат служат эмулируется основные атрибуты показатели анализируемого бизнес-процесса (то, внутренние по чему ведется fast анализ). Например, проблема для продаж позволяют это могут набор быть тип поддержка товара, регион, отдельные тип покупателя. В процессе качестве одного каждому из измерений используется технология время. На пересечениях систем осей - измерений (dimensions) - находятся можно данные, количественно измерений характеризующие процесс - меры (measures): связанные суммы и иные расширение агрегатные функции (min, max, avg, balanced дисперсия, ср. отклонение связанные и пр.). Каждое качестве измерение включает набор направления консолидации качестве данных, состоящие реляционная из серии последовательных прикладных уровней обобщения (уровней магазины иерархии), где связанные каждый вышестоящий зависимости уровень соответствует агрегатные большей степени реляционная агрегации данных balanced по соответствующему измерению (различные одна уровни их детализации). В поскольку этом случае пользователю становится возможным перечислены произвольный выбор достаточно желаемого уровня представление детализации информации результате по каждому из измерений.

Благодаря внутренние такой модели многомерную данных пользователи многомерные могут формулировать сильно сложные запросы, проблемы генерировать отчеты, схеме получать подмножества случаев данных.

Пример. Трехмерный многомерное куб, где иперкубов в качестве фактов надолго использованы суммы обычно продаж, а в качестве дает измерений - время, базы товар и магазин, analysis определенных на разных основанные уровнях группировки: товары группируются метки по категориям, магазины - по загрузки странам, а данные большие о времени совершения balanced операций - по месяцам.

Значения, "откладываемые" вдоль многомерные измерений, называются показателю членами или некоторые метками (members). Метки дальнейшем используются в операциях загрузки манипулирования измерениями.

Метки каждому могут объединяться загрузки в иерархии, состоящие многомерный из одного или внутренняя нескольких уровней содержащих детализации (levels). Например, наличии метки измерения "Магазин" (Store) естественно codd объединяются в иерархию привязанный с уровнями:

В соответствии называемый с уровнями иерархии данных вычисляются агрегатные можно значения, например объем проблема продаж для дает USA (уровень "Country") или позволяют для штата California (уровень "State"). В показатели одном измерении типичный можно реализовать analysis более одной члена иерархии - скажем, измерений для времени: {Год, snapshot Квартал, Месяц, упорядочение День} и {Год, отклонение Неделя, День}.

Поскольку хранилищу в рассмотренном примере осуществления в общем случае внутренние в каждой стране минимум может быть принятия несколько городов, множественных а в городе - несколько данных клиентов, можно несогласованна говорить об иерархиях многомерном значений в измерении - регион. В таблица этом случае таблице на первом уровне метакуба иерархии располагаются формулировать страны, на втором - города, сочетаний а на третьем - клиенты.

Иерархии country могут быть содержит сбалансированными (balanced), получения как, например, внутренние иерархия, представленная fact выше (такова соответствует же иерархии, основанные вычислении на данных типа "дата-время"), есть и несбалансированными (unbalanced). Типичный связанные пример несбалансированной эмулируется иерархии - иерархия иные типа "начальник-подчиненный".

Иногда state для таких наличии иерархий используется расширение термин Parent-child hierarchy.

Существуют также уровнях иерархии, занимающие представление промежуточное положение случае между сбалансированными сложных и несбалансированными (они сложных обозначаются термином ragged - "неровный"). Обычно сложные они содержат случае такие члены, метки логические "родители" которых модели находятся не на непосредственно codd вышестоящем уровне (например, таблице в географической иерархии информацию есть уровни Country, City и State, внутренние но при этом систем в наборе данных минимум имеются страны, разнообразных не имеющие штатов состоянии или регионов есть между уровнями Country и City).

Аналитические соответствует OLAP-операции:

· Сечение. многомерные При выполнении найти операции сечения state формируется подмножество измерений гиперкуба, в котором называемых значение одного наличии или более связанные измерений фиксировано (значение country параметров для третьем фиксированного, например, этом месяца).

· Вращение (rolling). многомерного Операция есть вращения изменяет совпадать порядок представления сформулировал измерений, обеспечивая доходах представление метакуба в более почти удобной для найти восприятия форме.

· зрения Консолидация ( rolling связанные up ). клиентские Включает серии такие обобщающие таблицей операции, как можно простое суммирование называемых значений (свертка) или хранить расчет с использованием хранимые сложных вычислений, server включающих другие informix связанные данные. Например, хранимые показателю для набор отдельных компаний называемый могут быть схема просто просуммированы arbor с целью получения прикладных показателей для hierarchy каждого города, между а показатели для члена городов могут элементах быть "свернуты" до таблице показателей по отдельным можно странам.

· Операция спуска (drill принятия doun). Операция, виде обратная консолидации, нескольких которая включает между отображение подробных неопределенные сведений для виде рассматриваемых консолидированных analysis данных.

· Разбиение с поворотом (slicing многомерного and dicing). случае Позволяет более получить представление дальнейшем данных с разных отдельные точек зрения. Например, наличии один срез дает данных о доходах центральном может содержать arbor все сведения сложные о доходах от продаж analysis товаров указанного связанные типа по каждому обычно городу. Другой качестве срез может принятия представлять данные server о доходах отдельной использующих компании в каждом shared из городов.

Поддержка многомерной числе модели данных вычислении и выполнение многомерного многомерный анализа данных таблица осуществляются отдельным многомерный приложением или snapshot процессом, называемым многомерное OLAP-сервером. Клиентские наиболее приложения могут помощью запрашивать требуемое между многомерное представление многомерную и в ответ получать множественных те или иные редко данные. При виде этом OLAP-серверы этом могут хранить клиентские многомерные данные некоторые разными способами

Результаты ходе экспериментов

Обеспечивая показатели многомерное быть концептуальное представление факт со стороны пользовательского information интерфейса к исходной отдельные базе данных, все неопределенные продукты OLAP прикладных делятся на несколько системы классов по типу расширение исходной БД. Многомерный использующих гиперкуб, используемый информацию в OLAP-технологии, может данных быть реализован объем в рамках реляционной сочетаний модели или вычислении существовать как снижает отдельная база основными данных специальной многомерную многомерной структуры. В server зависимости от этого позволяют принято различать инмона многомерный (MOLAP) и получать реляционный (ROLAP) подходы неопределенные к построению хранилища позволяют данных.

MOLAP ( многомерное Multidimensional OLAP пусть )

В MOLAP-модели иногда многомерное представление conceptual данных реализуется обратная физически. В специализированных быть СУБД, основанных база на многомерном представлении поскольку данных, данные члена организованы не в форме быть реляционных таблиц, быть а в виде упорядоченных вышестоящем многомерных массивов:

1. Гиперкубов (все есть хранимые в базе наличии данных ячейки таблицами должны иметь многомерное одинаковую размерность, state то есть находиться дает в максимально полном многомерном базисе измерений) и

2. Поликубов (каждая случае переменная хранится технология с собственным набором места измерений, и все привязанный связанные с этим cложности обработки обычно перекладываются на внутренние дальнейшем механизмы системы).

Использование многомерных многомерных баз соответствует данных в системах будущим оперативной аналитической нескольких обработки имеет члена следующие достоинства:

· Высокая наиболее производительность. В случае случае использования многомерных база СУБД поиск пусть и выборка данных одна осуществляется значительно таблица быстрее, чем надолго при многомерном будущим концептуальном взгляде сохранения на реляционную базу хранилищу данных, так случае как многомерная оптимального база данных денормализована, многомерном содержит заранее пусть агрегированные показатели данных и обеспечивает оптимизированный city доступ к запрашиваемым принятия ячейкам.

· Многомерные содержит СУБД легко содержит справляются с задачами быть включения в информационную осуществления модель разнообразных информацию встроенных функций, схеме тогда как olap объективно существующие консолидация ограничения языка снижает SQL делают случае выполнение этих доступ задач на основе таких реляционных СУБД есть достаточно сложным, иногда а иногда и невозможным.

Недостатки дальнейшем MOLAP-модели:

    Многомерные СУБД почти не позволяют работать центральном с большими базами fact данных. Многомерные СУБД balanced по сравнению с реляционными facts очень неэффективно совпадать используют внешнюю хранить память.        

  В подавляющем shared большинстве случаев analysis информационный гиперкуб есть является сильно

разреженным, а поскольку фактов данные хранятся показатели в упорядоченном виде, сочетаний неопределенные

значения удаётся доходах удалить только показатели за счет выбора достаточно оптимального порядка таблицей сортировки,

позволяющего организовать таких данные в максимально внутренняя большие непрерывные многомерный группы. Но даже

в случае этом случае analysis проблема решается нескольких только частично. Кроме набор того, оптимальный поддержка с точки

зрения хранения принятого разреженных данных хранимые порядок сортировки даже скорее всего зрения не будет совпадать

с таких порядком, который state чаще всего большого используется в запросах.

Следовательно, состоящие использование многомерных каждому СУБД оправдано главной только при случае следующих условиях:

1. Объем city исходных данных привязанный для анализа делают не слишком велик (не state более нескольких которых гигабайт), то есть продукты уровень агрегации качестве данных достаточно многомерном высок.

2. Набор пусть информационных измерений процесс стабилен (поскольку olap любое изменение отдельные в их структуре почти метки всегда требует сформулировал полной перестройки процесс гиперкуба).

3. Время центральном ответа системы привязка на нерегламентированные запросы пересчет является наиболее использование критичным параметром.

Примеры обратная OLAP-серверов, серии использующих MOLAP-архитектуру: Oracle дает Express Server фирмы Oracle, многомерных IBM Informix MetaCube, IBM содержит DB2 OLAP, Arbor большого Essbase.

ROLAP ( большого Relational OLAP многомерные )

Системы этом оперативной аналитической называемых обработки реляционных таблицей данных (ROLAP) позволяют conceptual представлять данные, совпадать хранимые в реляционной стороны базе, в многомерной одна форме, обеспечивая метакуба преобразование информации связанные в многомерную модель связанные через промежуточный нескольких слой метаданных. В таблицы этом случае многомерные гиперкуб эмулируется таблицей СУБД на логическом загрузки уровне.

Для большинства разбиение хранилищ данных информационных наиболее эффективным расчет способом моделирования таблицы N-мерного куба проблема фактов является обратная схема "звезда" (star данных schema).

Основными state составляющими структуры связанные хранилищ данных множественную являются таблица позволяют фактов (fact консолидация table) и процесс таблицы измерений (dimension может tables).

Таблица есть фактов является основной есть таблицей хранилища быть данных. Как факт правило, она сложные содержит сведения минимум об объектах или операция событиях, совокупность продаж которых будет несогласованна в дальнейшем анализироваться. Если члена проводить аналогию типичный с многомерной моделью, метки то строка таблицы informix фактов соответствует быть ячейке гиперкуба. Обычно множественных говорят о четырех выполнении наиболее часто серии встречающихся типах данные фактов.

К ним иперкубов относятся:

· факты, многомерных связанные с транзакциями (Transaction реляционной facts). Они state основаны на отдельных продаж событиях (типичными сформулировал примерами которых определяется являются телефонный наличии звонок или случаев снятие денег relational со счета с помощью базы банкомата);

· факты, расширение связанные с "моментальными несогласованна снимками" (Snapshot загрузки facts). Основаны informix на состоянии объекта (например, пересчет банковского счета) в расширение определенные моменты достаточно времени, например на конец analysis дня или сложных месяца. Типичными модели примерами таких одна фактов являются многомерном объем продаж доступ за день или state дневная выручка;

· факты, виде связанные с элементами иерархию документа (Line-item соответствует facts). Основаны которых на том или надолго ином документе (например, доступ счете за товар иерархию или услуги) и между содержат подробную разбиение информацию об элементах содержит этого документа (например, сложных количестве, цене, связанные проценте скидки);

· факты, операция связанные с событиями виде или состоянием серии объекта (Event многомерный or state таблицами facts). Представляют одна возникновение события схема без подробностей пользователю о нем (например, найти просто факт дальнейшем продажи или трехмерный факт отсутствия иногда таковой без делают иных подробностей).

Таблица стороны фактов индексируется отклонение по сложному ключу, концептуальной составленному из ключей иерархии отдельных изменений. При база этом как представлении ключевые, так многомерные и некоторые неключевые поля вдоль таблицы фактов стороны должны соответствовать использующих будущим измерениям счете OLAP-куба. Помимо этого таблица верхним фактов содержит поскольку одно или есть несколько числовых dicing полей, на основании эмулируется которых в дальнейшем найти будут получены получать агрегатные данные.

Выводы информационных и пусть заключение

1. Для многомерного сильно анализа пригодны концептуальной таблицы фактов, выполнении содержащие как трехмерный можно более случаев подробные данные, иерархии то есть соответствующие многомерный членам нижних центральном уровней иерархии таблице соответствующих измерений.

2. В можно таблице фактов помощью отсутствуют какие-либо хранимые сведения о том, даже как группировать использование записи при называемых вычислении агрегатных включает данных.

Таблица измерений таблицей содержит принятия неизменяемые или виде редко изменяемые перечислены данные. В каждой иные таблице измерений state перечислены возможные расчет значения одного большого из измерений гиперкуба. В вычислении подавляющем большинстве операция случаев эти есть данные представляют arbor собой по одной данные записи для называемых каждого члена вращение нижнего уровня центральном иерархии в измерении. Таблицы каждому измерений также упорядочение содержат как наличии минимум одно иерархии описательное поле (обычно warehouse с именем члена хранить измерения) и, как иерархию правило, целочисленное центральном ключевое поле (обычно редко это суррогатный представление ключ) для fact однозначной идентификации формулировать члена измерения. Каждая измерений таблица измерений хранить должна находиться которых в отношении "один атрибуты ко многим" с таблицей инмона фактов.

Причина, по которой третьем данная схема оликубов названа "звездой" достаточно многомерные очевидна. Концы вращение звезды образуются подавляющем таблицами измерений, случаев а их с таблицей фактов, доступ расположенной в центре, часто образуют лучи. В разбиение терминологии Кодда, более каждый луч этом схемы звезды которых задает направление факт консолидации данных информационных по соответствующему измерению.

В разнообразных схеме "звезда" каждое подходы измерение куба помощью содержится в одной balanced таблице, в том члена числе и при набор наличии нескольких часто уровней иерархии (государство - регион - нас. пункт в country таблице "Покупатель", числе год - месяц - день основными в таблице "Период").

В виде сложных задачах элементах с многоуровневыми измерениями многомерную используются различные объем расширения схемы "звезда" - получения схема "снежинка" (snowflake пользователю schema). Это целочисленное расширение может использующих проявляться в двух иные разновидностях.

1. В случае многомерном большого числа схема сложных атрибутов сравнению в таблице измерений, события некоторые атрибуты стороны могут быть зрения детализированы в отдельных данные таблицах измерений. Иными таблицы словами отдельные внутренние измерения содержатся связанные не в одной, а в нескольких называемым связанных между таблицами собой таблицах. Дополнительные доступ таблицы измерений information в такой схеме, arbor обычно соответствующие внутренняя верхним уровням таблица иерархии измерения главной и находящиеся в соотношении "один представление ко многим" в главной минимум таблице измерений, оликубов соответствующей нижнему формулировать уровню иерархии, парадоксальная иногда называют проблема консольными таблицами (outrigger вычислении table).

Например, вычислении из таблицы "Покупатель" можно state изъять описания dice региона, населенного клиентские пункта (оставив показатели лишь их ключи) и серии хранить их в отдельных продукты дополнительных таблицах. Это нескольких уменьшит степень показателю дублирования информации, information но снижает скорость предметную выполнения запросов, наличии поскольку увеличивает многомерную степень нормализации. Поэтому называемых даже при хранимые наличии иерархических позволяют измерений с целью каждый повышения скорости технология выполнения запросов часто к хранилищу данных balanced нередко предпочтение часто отдается схеме "звезда".

2. Другое агрегатные расширение связано оликубов с созданием отдельных сложные таблиц фактов зависимости для всех этом возможных сочетаний множественных уровней обобщения каждому различных измерений.

Увеличение связанные числа таблиц informix фактов в базе атрибуты данных может arbor проистекать не только хранить из множественности уровней отдельные различных измерений, зрения но и из того обстоятельства, некоторые что в общем случае случае факты называемых имеют разные хранить множества измерений. При атрибуты абстрагировании от отдельных таблицы измерений пользователь атрибуты должен получать многомерную проекцию максимально центральном полного гиперкуба, внутренние причем далеко привязка не всегда значения парадоксальная показателей в ней системы должны являться будущим результатом элементарного поскольку суммирования. Таким совпадать образом, при называемых большом числе концептуальной независимых измерений codd необходимо поддерживать инмона множество таблиц данных фактов, соответствующих многомерных каждому возможному систем сочетанию выбранных таблицами в запросе измерений.

Это позволяет добиться лучшей производительности, но часто приводит к избыточности данных и к значительным усложнениям в структуре базы данных, в которой оказывается огромное количество таблиц фактов

При такой структуре базы данных большинство запросов из области делового анализа объединяют центральную таблицу фактов с одной или несколькими таблицами измерений.

Пример: получить средние объемы продаж товаров каждого поставщика с разбивкой по покупателям и по месяцам.

В любом случае, если многомерная модель реализуется в виде реляционной базы данных, следует создавать длинные и "узкие" таблицы фактов и сравнительно небольшие и "широкие" таблицы измерений. Таблицы фактов содержат численные значения ячеек гиперкуба, а остальные таблицы определяют содержащий их многомерный базис измерений. Часть информации можно получать с помощью динамической агрегации данных, распределенных по незвездообразным нормализованным структурам, хотя при этом следует помнить, что включающие агрегацию запросы при высоконормализованной структуре базы данных могут выполняться довольно медленно.

       

Список использованных конечном источников

1. Базы данных: модели, разработка. - СПб.: Питер, 2001, 304 с.

2. Информационные системы. – СПб.: Питер, 2002.

3. ведение в системы баз данных: Пер. с англ. - М.: Наука, 1980. - 464 с.

4. Фрай Дж. Проектирование структур баз данных: В 2-х кн. Пер. с англ. - М.: Мир, 1985. - 287 с., ил.

5. , Проектирование баз данных информационных систем. - М.: Финансы и статистика, 1989.