УДК 004.8

Институт автоматики и процессов управления ДВО РАН

E-mail: *****@***dvo. ru

Россия

Каталог структурных свойств owl-, oil-, kif-онтологий[1]

Использование онтологий в сфере искусственного интеллекта диктует необходимость оценивания свойств онтологий. Свойства онтологии важны по той причине, что они могут влиять на свойства интеллектуальных систем управления базами знаний. В статье представлен каталог структурных свойств для оценивания «широкого спектра» онтологий.

1. Вступление

Своевременное оценивание свойств онтологий важно при их создании и сопровождении. Свойства онтологии важны по той причине, что они могут влиять на свойства интеллектуальных систем управления базами знаний и других программных средств, создаваемых на основе онтологий, а также на легкость понимания самой онтологии, на понимание информации, передаваемой с помощью терминов онтологии, на возможность повторного использования информации.

Целью исследования свойств онтологий является разработка единого подхода к оцениванию онтологий разных уровней общности и разных предметных областей, позволяющего на практике проверять и анализировать такие онтологии, минимизируя субъективность при оценивании. Одним из направлений исследований здесь является разработка методологии для измерения структурных свойств, позволяющих:

- проверять корректность и согласованность определяемых терминов в модели онтологии;

- изучать онтологию и составлять представление о структуре соответствующей предметной области,

- сравнивать разные модели онтологий в одной предметной области;

НЕ нашли? Не то? Что вы ищете?

- сопоставлять онтологии «на стыке» предметных областей для оценивания возможностей их интеграции,

- оценивать морфологические свойства онтологии с целью обнаружить «отклонение» ее структуры от закономерностей, выявленных на основе анализа описания структур других онтологий в рассматриваемой предметной области;

В литературе отсутствует единство в определении свойств, предлагаемых для оценивания онтологий [1-4]. Поэтому разработанная универсальная классификация свойств онтологий [5] явилась одним из результатов, обеспечивающих развитие единого подхода к оцениванию онтологий разных уровней общности. Такая классификация обеспечивает «каркас» для представления различных структурных свойств, пригодных для оценивания различных онтологий на практике.

Разработка методологии для измерения структурных свойств включает следующие шаги:

1) Создание терминологического базиса для однозначного определения измеряемых свойств (это «второе» необходимое условие для объективности оценивания после разработки универсальной классификация свойств);

2) формирование однозначных определений свойств в заданных терминах;

3) формирование групп (подкатегорий) структурных свойств, уместных для любых онтологий, для онтологий, написанных на языке kif и его «надстройках», на языках Oil, owl и DAML+owl.

4) выявление «зависимости» отдельных свойств, а также групп свойств от «предназначения языков» (расширяемые языки исследования реальных онтологий или «ограниченные» языки написания онтологий для конкретных проектов);

5) создать средство оценивания структурных свойств – каталог;

6) создать прототипы измерительных инструментов и провести эксперимент с целью исследования трудозатрат на оценивание и выявления реальных потребностей практики.

Следовательно, создание каталога точных определений структурных свойств всех категорий (в рамках универсальной классификации свойств онтологий) необходимо для оценивания «широкого спектра» онтологий.

Необходимость такого каталога продиктована, в частности, тем, что автору не удалось найти такого каталога\перечня\глоссария определений свойств (а также дефектов) для оценивания онтологий. Существующие методы оценивания онтологий реализованы в разнообразных редакторах и анализаторах онтологий, но инструменты специализированы, а круг оцениваемых свойств в них ограничен.

2. Структура каталога структурных свойств

Расположение определений свойств в соответствии с универсальной классификацией способствует выбору нужного набора свойств. Способ использования каталога схематически можно описать так: выделить интересующую группу свойств (ориентируясь на языки, комментарии и опыт оценивания), построить упрощенное (внутреннее) представление онтологии (описанное как терминологический базис для этой группы), найти значения свойств в соответствии с однозначными определениями в каталоге.

Порядок представления категорий свойств в каталоге:

Общее назначение свойств этой категории;

Терминологический базис;

Список определений свойств этой категории (возможно, разбитый по подкатегориям). Внутри [под]категории возможны «разграничения» для групп свойств (для языков oil и owl, например, и для kif-языков).

Структура определения свойства такова:

Название свойства;

Определение литературное (если есть);

Определение в заданных терминах;

Комментарий или рекомендация (если есть).

Основные категории свойств в каталоге - свойства, относящиеся к архитектуре онтологии, свойства структуры отношений в онтологии, свойства структуры определений.

3. Свойства, относящиеся к архитектуре онтологии

Свойства этой категории важны при создании многомодульных онтологий, при повторном использовании готовых модулей для создания новой онтологии, при интегрировании онтологий.

Необходимые базовые термины: граф использования модулей онтологии и граф включения модулей онтологии.

Граф использования модулей онтологии (ИЛИ граф межмодульных обращений онтологии) – графовая модель <В, Д>,

где вершины В = {Вi}, Вi соответствует модулю онтологии (характеризуется меткой – именем модуля),

а дуги Д = {Дj}, Дjсвязь «ссылается», рекомендовано два вида связи: «в заголовке модуля есть ссылка на другой модуль» и «модуль фактически ссылается»[2] (в тексте модуля использовано имя термина из другого модуля),

дуги имеют метку, содержащую список имен используемых терминов из «ссылочного» модуля.

Граф включения модулей онтологии – графовая модель <В, Д>,

где вершины В = {Вi}, Вi соответствует модулю онтологии,

а Д = {Дj}, дугами - связи типа «включает», семантика их такова – определяемый модуль включает один или несколько ранее определенных модулей, т. е. все определяемые понятия из включаемых модулей добавляются к понятиям включающего модуля[3] (inclusion realizes, at the including theory level, the union of the sets of definitions relative to all of the theories).

3. 1 Свойства онтологии как совокупности (или иерархии) модулей:

Пример определения свойства в базовых терминах:

Модульность (modularity)[4] – наличие более одной вершины (модуля) в графе включения модулей онтологии (шкала значений – номинальная {Да, Нет}) или число вершин в графе включения модулей онтологии (шкала значений - абсолютная).

Комментарий. Модульность означает, как правило, перспективность повторного использования онтологий, снижение трудозатрат при проверке и сопровождении онтологий.

Также приводятся определения в базовых терминах таких свойств, как

число связей использования между парой модулей,

наличие цикличных включений

и др. свойства.

3. 2. Свойства модуля[5]

Пример определения свойства (для выбранного для измерения модуля онтологии) в базовых терминах:

Включающие модули - число дуг-связей «включает», входящих в вершину (измеряемый модуль) в графе включения модулей онтологии (шкала значений - абсолютная).

·Комментарий. Чем больше значение свойства, тем больше дополнительных модулей необходимо проверить для гарантирования качества информации в измеряемом модуле.

Также приводятся определения в базовых терминах таких свойств, как:

включаемые модули,

включение модуля, содержащего специализируемое понятие,

фактическое использование понятий из используемых модулей,

включаемые модули, из которых не используется явно ни одно понятие,

не включаемые модули, из которых тем не менее используются сущности,

наличие неопределенных сущностей,

сцепление пары модулей.

4. Свойства структуры отношений в онтологии

Свойства этой категории важны для оценивания и сопоставления классификаций терминов, для оценивания степени «проработанности» моделируемых предметных областей, для поиска структурных дефектов онтологий, для оценивания структурной сложности онтологий разных уровней общности и разных предметных областей, для сравнения и сопоставления особенностей онтологий предметных областей и выявления типичных видов связей между понятиями в онтологиях разных предметных областей.

4.1 Свойства однородной структуры

4.1.1. свойства таксономии

Базовые термины: граф таксономии сущностей [модуля] онтологии и граф таксономии связей [модуля] онтологии.

Граф таксономии сущностей [модуля] онтологии – графовая модель <В, Д>,

где вершины В = {в-i}, в-i соответствует сущности (классу сущностей) [модуля] онтологии,

а дуги Д = {д-j}, д-jсвязи двух видов: «является представителем» и «является потомком».

При этом «Сущность1 является представителем Типа1\Сорта1\Класса1» равносильно тому, что сущность1 является членом (элементом) множества сущностей, обозначаемого этим Типом1\Сортом1\Классом1. «Тип1\Класс1 сущностей является потомком (подклассом, частным случаем) Типа2\Класса2» означает, что все множество всех представителей Типа1\Класса1 составляет подмножество множества всех представителей Типа2\Класса2.

граф таксономии связей [модуля] онтологии – графовая модель <В, Д>,

где вершины В = {в-i}, в-i - связи (отношения, функции, атрибуты),

а дуги Д = {д-j}, д-jсвязи двух видов: «является представителем» и «является потомком».

Пример определения свойства (для измеряемого модуля или всей онтологии) в базовых терминах:

Размер модуля\онтологии – суммарное число вершин в графе таксономии сущностей [модуля] онтологии и вершин в графе таксономии связей (шкала значений - абсолютная).

Также приводятся определения в базовых терминах таких свойств, как:

"размер набора" (листовых вершин),

число связных компонентов графа таксономии,

глубина модели иерархии, ширина дерева понятий,

общее количество отношений,

количество созданных экземпляров,

число корневых классов,

число классов, не имеющих потомков,

отсутствие циклов в модели наследования,

число переопределений понятия,

наличие избыточности при определении подклассов,

наличие избыточности при определении представителя.

4.1.2. Свойства партономии:

Базовые термины: граф партономии [модуля] онтологии (возможно использование базового термина граф таксономии связей [модуля] онтологии).

Граф партономии [модуля] онтологии[6] – графовая модель <В, Д>,

где вершины В = {в-i}, в-i - сущности (классы сущностей) [модуля] онтологии,

а дуги Д = {д-j}, д-jсвязи[7] следующих видов: является последовательностью (термин определен как последовательность терминов), является множеством (Термин определен как множество терминов), является объединением множеств (термин определен как объединение терминов-множеств), является одним из (термин, определяемый множеством всех своих представителей).

Для выбора связей часть-целое (например, в онтологиях на kif) следует рассмотреть граф таксономии связей онтологии и «вычленить» там все потомков отношения «часть-целое» и само это отношение (для онтологий, доступных посредством «ontolingua», это отношение part-of из модуля mereology [6]).

Пример определения свойства в базовых терминах:

Число разных партономических связей – число разных видов связей, относящихся к категории «целое-часть» - число разных видов дуг в графе партономии [модуля] онтологии (шкала значений - абсолютная).

·Комментарий. Значение свойства связано с особенностями предметной области либо.

Также приводятся определения в базовых терминах таких свойств, как:

размер партономии,

глубина партономических связей,

«перекрываемость частей»,

число компонентов, связанных с данной сущностью связями «часть - целое» разного вида,

наличие циклической связи «часть-целое» в партономии,

4.1.3. Свойства отношений причинности

Базовые термины: граф причинно-следственных связей [модуля] онтологии (с использованием графа таксономии связей [модуля] онтологии).

граф причинно-следственных связей [модуля] онтологии – графовая модель <В, Д>,

где вершины В = {в-i}, в-i - сущности (классы сущностей) [модуля] онтологии,

а дуги Д = {д-j}, д-jсвязи вида: влияет на (?или «следует»), имеющие метку с названием связи)).

Для выбора причинно-следственных связей можно рассмотреть таксономию отношений и «вычленить там» все потомков отношения «является инициатором процесса», и само это отношение (для онтологий, доступных посредством редактора или броузера ontolingua, это отношение from-actor и from-actor-of из модуля actors). (Возможно, сюда же следует отнести потомков отношений by-actor и by-actor-of).

Т. о. для построения графа причинно-следственных связей необходимо использовать граф таксономии связей онтологии.

Пример определения свойства в базовых терминах:

Наличие причинно-следственной связи между двумя сущностяминаличие пути между двумя соответствующими вершинами в графе причинно-следственных связей (шкала значений – номинальная {Да, Нет}).

Также приводятся определения в базовых терминах таких свойств, как:

максимальная длина причинно-следственной цепочки,

наличие «концентратора» причинно-следственной связи,

число разных отношений причинности,

наличие\отсутствие циклов среди причинно-следственных связей между сущностями".

4.1.4. Свойства структуры пространственных отношений

Базовые термины: граф пространственных связей [модуля] онтологии (используется ранее определенный базовый термин граф таксономии связей [модуля] онтологии).

граф пространственных связей [модуля] онтологии – графовая модель <В, Д>,

где вершины В = {в-i}, в-i - сущности (классы сущностей) онтологии,

а дуги Д = {д-j}, д-j – «пространственная» связь между сущностями, которая упоминается в определениях [модуля] онтологии, дуги имеют метку, содержащую название пространственной связи из предметной области. Для выбора пространственных связей необходимо рассмотреть граф таксономии связей онтологии и «вычленить» там все потомков (абстрактного) отношения «находится в границах», и само это отношение (для онтологий, доступных посредством броузера ontolingua, это отношение in-actor и in-actor-of из модуля actors и такие, как exactly–located, wholly–located, paartly–located, generic–located).

Пример определения свойства в базовых терминах:

наличие циклов среди связей между сущностями "по пространственному включению" друг друга наличие циклического пути между некоторыми двумя вершинами в графе пространственных связей (шкала значений – номинальная {Да, Нет}).

Комментарий. Значение «да» - повод для проверки корректности определенных в онтологии пространственных связей.

Приводятся определения в базовых терминах таких свойств, как

·непротиворечивость взаимного пространственного расположения сущностей;

·число разных пространственных отношений.

4.1.5. Cвойства структуры ролевых отношений

Базовые термины: граф ролевых связей [модуля] онтологии (используется ранее определенные базовые термины граф таксономии сущностей [модуля] онтологии и граф таксономии связей онтологии).

Граф ролевых связей [модуля] онтологии – графовая модель <В, Д>,

где вершины В = {в-i}, в-i - сущности – деятельности (активности) онтологии, в частности определяемые в онтологии (модуле) потомки сущности «act» и потомки сущности «процесс» [7],

а дуги Д = {д-j}, д-j – «ролевая» связь (упоминаемая в определениях [модуля] онтологии) между сущностями, одного из видов: связь с инструментом, связь с так называемым агентом (тем, кто осуществляет действие), связь с результатом (result) или с целью, связь с так называемым субъектом (patient). При этом дуги имеют метку, содержащую название ролевой связи. (

Для выбора ролевых связей необходимо рассмотреть граф таксономии связей онтологии и «вычленить» там всех потомков абстрактных ролевых отношений (для доступных посредством броузера ontolingua онтологий - «to-actor-of», «from-actor-of», «instrument, instrument-of»).

Пример определения свойства в базовых терминах:

полнота связей деятельности с агентом, субъектом, инструментом и ожидаемым результатом наличие для сущности-активности (деятельности) в графе ролевых связей модуля онтологии дуг всех четырех видов: связь с инструментом, связь с агентом, связь с результатом, связь с субъектом (шкала значений – номинальная {Да, Нет}).

Также приводятся определения в базовых терминах таких свойств, как:

отсутствие для вершины – активности более двух видов ролевых связей;

наличие связей, возможно, «посторонних» для рассматриваемой деятельности (например, между агентом и субъектом).

4.2. «Совместные» структурные свойства двух видов структуры

4.2.1. свойства таксономии и партономии:

Пример определения свойства в базовых терминах:

«Неявное пересечение подклассов» - наличие двух вершин, связанных с третьей вершиной дугой «является потомком» и одновременно связанных друг с другом дугой «целое-часть» (шкала значений – номинальная {Да, Нет}).

Взаимоисключение связей наследования и агрегирования – наличие двух вершин в «объединении графа таксономии с графом партономии», соединенных дугами, среди которых хотя бы одна «является потомком» и хотя бы одна «партономическая дуга» (шкала значений – номинальная {Да, Нет}).

Также приводятся определения в базовых терминах таких свойств, как:

множество пар сущностей, для которых связи часть-целое и общее-частное «сонаправлены»\ «противоположно направлены»\ «сопутствуют» (и часть и целое имеют общего предка) \ никак не зависимы;

наличие\отсутствие избыточности\противоречивости партономических связей на одном пути от вершины таксономии к листовой вершине в таксономии;

4.2.2 свойства таксономии и некоторой топологической структуры:

Примеры определения свойств в базовых терминах:

Отсутствие избыточности в свойствах или поведении сущности (у "предка" этой сущности такое свойство (связь) уже определено(-а)) – наличие двух вершин, связанных путем в графе таксономии и имеющих одинаковую дугу с некоторой третьей вершиной в графе с не-таксономической структурой.

Наличие связи (не-таксономической) между двумя сущностями, более абстрактной, чем связь между их предками – наличие двух пар вершин <Предок1, Потомок1> и <Предок2, Потомок2> (пара связана путем в графе таксономии сущностей), и дуги СвязьА от Потомка1 к Потомку2, а дуги СвязьБ от Предка1 к Предку2 в графе с не-таксономической структурой, таких что вершина, соответствующая СвязиА в графе таксономии связей онтологии, и вершина, соответствующая СвязиБ, связаны путем из дуг «является потомком» в графе таксономии связей онтологии.

Также приводятся определения в базовых терминах таких свойств, как:

«полезность» множества свойств сущности,

согласованность кардинальности некоторой топологической связи, указываемой и для предка, и для потомка,

неудовлетворительная характеристика непересекаемости понятий верхнего уровня,

наличие признаков «неудовлетворительной классификации»,

наличие признаков несогласованности определений.

4.3. «Совместные» структурные свойства трех и более видов структуры;

4.3.1. Свойства таксономии и всей топологической структуры:

Приводится определения в базовых терминах свойств:

наличие\отсутствие избыточности\противоречивости среди любых топологических связей на одном пути от вершины таксономии к листовой вершине в таксономии;

наличие потомка у некоторой сущности, не обладающего никакими особенностями,

некорректность области определения\значений,

неполнота области определения\значений,

наличие неявных подклассов,

число потомков у сущности, которые являются областью определения некоторой связи.

4.3.2 Свойства таксономии, партономии и некоторой топологической структуры:

Приводится определения в базовых терминах таких свойств как:

«заменяемость» сущностей,

число классов, которые «недоопределены» (указан их предок и неформально – их смысл);

число классов, для которых указаны только предок и представители класса;

наличие двух или более вершин – [классов] сущностей, связанных одинаковыми дугами нескольких видов структур;

"полнота" связей по наследованию (наличие сущностей с одинаковыми свойствами и поведением, но различными областями значения некоторого свойства).

5. Свойства структуры определений

Свойства этой категории важны для контроля достаточности и неизбыточности множества определяемых терминов (понятий), среди них:

свойства определения термина, определяемые по так называемой простой структуре определения (документированность формального определения, согласованность внутри определения понятия, несвязность формальной и неформальной частей определения, наличие неформальной части онтологии (напр, комментариев), которая трудно сопоставима с содержанием формальной части, число\доля названий функций с «низкой мнемоничностью», наличие единства в именовании понятий и др. свойства.),

свойства связи определений терминов, определяемые по графу связей определяемых понятий и граф зависимости определяемых функций (глубина зависимости определяемых понятий, число «листовых» вершин в графе связей определяемых понятий, корректность использования терминов, наличие\отсутствие рекурсий или циклов между определениями, число рекурсивно определяемых терминов, число несвязанных подграфов в графе, наличие многократно используемых понятий, глубина зависимости определяемых функций, число функций, использующих имена других функций только из данного модуля, число\доля функций, использующих «определенные вне» функции, множество\число функций, используемых для определения функций данного модуля),

а также свойства определений сущностей (в рамках совокупности определений), определяемые по совокупности структурных определений сущностей, свойства определений связей (в рамках совокупности определений) определяемые по структурным определениям связи и свойства совокупности определений и онтологических соглашений.

Заключение.

Поскольку свойства онтологии важны и для разработчиков онтологий (инженеров знания и, возможно, экспертов предметных областей) и для их пользователей (пользователей систем основанных на знаниях, разработчиков систем основанных на знаниях и, возможно, экспертов предметных областей), то эти вышеупомянутые специалисты являются потенциальными потребителями формируемого каталога.

Инженеры знания и студенты, обучающиеся информационным технологиям, могут использовать каталог для понимания основных требований, которые могут быть предъявлены к разрабатываемой ими онтологии, разработчики систем основанных на знаниях могут использовать этот каталог для понимания критериев, которые они могут предъявить при оценивании возможности использовать конкретную онтологию для разрабатываемой системы. Что касается экспертов предметных областей (принимающих участие в создании онтологий), то каталог предоставляет им возможность увидеть и учесть многообразие структур различных онтологий и связанных с ними предметных областей.

Специалистам по оцениванию онтологий каталог позволит сосредоточиться на исследовании структурных свойств различных онтологий, помогая изучать как «реальные онтологии», для разработки которых чаще используют «языки исследования» (расширяемые), так и «онтологии для конкретных проектов», которые пишутся на «ограниченных» языках, таких, как oil, owl.

CATALOGUE OF ONTOLOGY’S STRUCTURE PROPERTIES. The use of ontology in of Artificial Intelligence dictates the necessity of the ontology’s properties evaluation. Ontology’s properties is important because they have an influence on the characteristics of the intellectual systems that control the knowledge bases. This paper presents a structural properties’ catalogue for evaluating the “wide” spectrum of ontologies.

Список литературы

1. Teeuw W. B., van den Berg H. On the Quality of Conceptual Models // Proceedings of the ER'97 workshop on behavioral models and design transformations: Issues and opportunities in conceptual modeling / Liddle S. W. Los Angeles, CA, USA -

November 6-7, 1997. - http://u. edu/ER97/workshop4/tvdb. html.

2. Gruber T. R., Olsen G. R. Ontology for Engineering Mathematics, 1994. http://www-ksl. stanford. edu/knowledge-sharing/papers/fn19

3. Gruber T. R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. 1993. http://citeseer. ist. psu. edu/cache/papers/cs/490/http:zSzzSzwww-ksl. stanford. eduzSzknowledge-sharingzSzpaperszSzonto-design. pdf/gruber93toward. pdf

4. Studer R., Benjamins V. R., Fensel D. Knowledge engineering, principles and methods // Data and Knowledge Engineering. 1998 No. 25 (1-2). P. 161-197, http://citeseer. nj. /cache/papers/cs/8679/ftp:zSzzSzftp. aifb. uni-karlsruhe. dezSzpubzSzmikezSzdfezSzpaperzSzDKE98.pdf/studer98knowledge. pdf

5. «Классификация свойств онтологий. Свойства онтологий и их классификации», Научно-техническая информация, серия 2, 2005, No 11, с. 9-16.

6. http://www. loa-cnr. it/medicine/mereology/index. html

7. http://www. ontologyportal. org/

[1] Работа выполнена при финансовой поддержке ДВО РАН в рамках Программы №15 ОЭММПУ РАН, проект "Синтез интеллектуальных систем управления базами знаний и базами данных" и по программе РФФИ, проект 06-07-89071-а "Исследование возможностей коллективного управления в семантическом вебе информационными ресурсами различных уровней общности".

[2] Введение дуги «фактически ссылается» удобно для ситуаций, когда нет другого способа проконтролировать, корректно ли разработчик онтологии указал все межмодульные связи.

[3] Анализ включения особенно важен для многоуровневых онтологий.

[4] означает декомпозицию большой онтологии на модули (individual ontologies) по принципу структуры их «включения» (inclusion lattice) [2,4]

[5] Здесь модуль рассматривается без подключения определений из включаемых модулей.

[6] Кроме того, интересны для определения некоторых свойств «потомственные» графы – граф партономии, в котором (при наличии вершин (сущностей) – потомков согласно графу таксономии) связи перенесены с предков на потомков, наследующих связи, граф причинно-следственных связей с перенесенными связями от предков и аналогичные графы для других определяемых ниже графов.

[7] Разумным представляется включать в граф партономии как связи, упоминаемые в определениях понятий, так и указываемые в онтологических соотношениях.