Использование классификационного подхода
при описании допустимых сочетаний реквизитов-признаков
, ,
Кафедра информационных технологий, Российский университет дружбы народов,
*****@***ru, *****@***pfu. edu. ru, *****@***pfu. edu. ru
В работе рассмотрены возможные варианты классификации данных при определении допустимых сочетаний значений реквизитов-признаков в процессе разработки информационных систем, основанных на многомерном подходе. В основе классификационного подхода лежит выделение групп значений реквизитов-признаков, которые объединены сходным поведением по отношению к связям между компонентами системы.
Ключевые слова: многомерные модели данных, классификационная схема, модель метаданных, классифицируемые реквизиты-признаки, неклассифицируемые реквизиты-признаки, наблюдаемые явления.
Введение
В случае использования многомерного подхода данные информационной системы формируются на основе допустимых значений характеристик наблюдаемых явлений в виде сочетаний допустимых значений реквизитов-признаков, определяющих значения анализируемых показателей. Хранилища данных в таких системах могут характеризоваться существенной неравномерностью и разреженностью [1].
Аналитическое пространство, моделирующее сложное наблюдаемое явление, имеет структуру, которую можно анализировать в аспекте отдельных компонент наблюдаемого явления. Для обеспечения такого анализа можно использовать классификационный подход, при котором для отдельных структурных составляющих наблюдаемого явления формируется классификационные схемы, выражающие семантику этих компонент. При этом выбор состава и формирование содержания классификационных схем должно производиться на базе выявления и анализа классификационных признаков соответствующей составляющей наблюдаемого явления. Разработка формального подхода для описания классификационных схем, выражающих свойства фрагментов наблюдаемого явления, позволит решить задачу ранжирования классификационных признаков и построения аналитического пространства многомерной системы в виде множества сочетаний допустимых значений реквизитов-признаков.
Постановка задачи
С позиции описания структуры метамодели информационной системы задачу можно сформулировать следующим образом. Совокупность классифицируемых реквизитов-признаков (КРП), которые определяют первичный показатель, выражающий некоторое наблюдаемое явление, образует n-мерное аналитическое пространство – многомерный куб. КРП являются размерностями этого куба. Определен список всех возможных значений КРП. При описании первичного показателя используется часть этих значений – допустимые значения КРП. Сочетание этих значений, по одному для каждого из КРП, соответствует одной из ячеек многомерного куба. Помимо допустимых значений, классифицируемому реквизиту-признаку может быть присвоено специальное значение “не используется”. Присвоение этого специального значения соответствует случаю, когда данные, характеризующие ячейку, не связаны с соответствующим КРП. При описании первичного показателя используются не все возможные сочетания значений КРП, а их часть, составляющее множество сочетаний допустимых значений. Задача состоит в том, чтобы разработать формальный подход для описания множества сочетаний допустимых значений (множество СДЗ), представляющий данные СДЗ в компактной форме и отражающий структуру первичного показателя.
Методы построения классификационных схем
В информационных системах, основанных на многомерном подходе, может быть применено несколько вариантов построения систем классификации, формирующих правила, на основании которых происходит разбиение используемых в них объектов на группы. Среди них можно выделить основные: иерархический и фасетный.
При иерархическом подходе к классификации реквизиты-признаки, выбранные в качестве классификационных признаков, должны быть отнесены к тому или иному классу на разных уровнях иерархии. Соответствующая схема классификации может быть описана в виде связного ациклического графа G=(V, E), в котором элементами множества вершин V графа являются группы объектов информационной системы (группы значений классифицируемых реквизитов-признаков), ребра из множества E задают отношения иерархии между выделенными группами объектов. При этом выбор классификационных признаков для конкретного класса вытекает из семантического содержания рассматриваемой компоненты наблюдаемого явления. В процессе построения дерева G последовательно раскрывается смысл классифицируемых реквизитов-признаков в аспекте наблюдаемого явления, и выявляется состав групп значений реквизитов-признаков, которые формируют сочетания из множества СДЗ.
Использование фасетного подхода к классификации объектов в информационных системах приводит к разбиению исходного множества неклассифицированных объектов на подмножества. В информационных системах, построенных на базе многомерного подхода, в качестве классификационных признаков естественным образом выступают классифицируемые реквизиты-признаки, а значениями классификационных признаков в фасетах могут быть использованы группы, выявленные в процессе применения иерархического подхода. Применение одновременно иерархического и фасетного подходов позволяет сформировать группы значений реквизитов-признаков и построить при помощи этих групп множество СДЗ, которое выражает структуру отдельной компоненты наблюдаемого явления, для описания которой создается классификационная схема.
Литература
1. , Методы описания допустимых сочетаний реквизитов-признаков при использовании многомерных моделей в инфокоммуникационных системах // T-Comm. – Телекоммуникации и Транспорт. – 2012. – № 7. – С. 45-47.
USE classification approach in the description of the permissible combination of detail-attributes
L. Alexandrova, E. Kuznetcov, M. Fomin
Department of Information Technologies, Peoples’ Friendship University of Russia,
*****@***ru, *****@***pfu. edu. ru, *****@***pfu. edu. ru
We investigate the possible methods of classifying data when determining combinations of the permissible values of the detail-attributes in the process of developing information systems, based on a multidimensional approach. The method is based on the construction of groups of values of detail-attributes, which have a similar behavior with respect to the relationship between the components of the system.
Key words – multidimensional data models, classification scheme, classified detail-attributes, non-classified detail-attributes, observed phenomena.


