САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Факультет искусств
Направление 230700 «Прикладная информатика»
Ханукова Дмитрия Георгиевича
АВТОРЕФЕРАТ
Разработка методов и средств конвертирования, тестирования
и оптимизации онтологий (на примере онтологии InTez)
Выпускная квалификационная работа
магистра прикладной информатики
Научный руководитель:
профессор СПбГУ, д. т. н
Рецензент:
зав. лаб. ИВС СПИИРАН, д. т. н.
Санкт-Петербург
2013
В данной работе рассмотрены выразительные возможности и основные синтаксические конструкции языка описания онтологий OWL2 и его синтаксические конструкции. Рассмотрена функциональность и инструментальные средства онтологии InTez, её операционная среда и структура хранения данных. Описан процесс создания программы конвертора данных InTez в формат OWL2, описан алгоритм данной программы и основные конструкции, которые возможно или невозможно конвертировать. Проведен анализ возможностей и работы Inference Engines для проверки корректности данных в формате OWL2, полученных путём конвертирования из онтологии InTez. Описано сравнение различных семантических резонеров (Semantic Reasoner) и их функциональные возможности, а так же рассмотрены результаты проверки выходных данных. Показаны возможности и удобство работы с данными в формате OWL2 в онторедакторе Protégé и его возможности.
Объектом исследования является возможность конвертирования данных из онтологии InTez в формат OWL.
Актуальность работы обуславливается возможностью для онтологии InTez стать более унифицированной, и возможность конвертации данных позволяет проверить их корректность и корректность связей в InTez с помощью Inference Engines для OWL.
Цель работы — разработка конвертора, обеспечивающая экспорт данных из онтологии InTez в формат OWL в процессе её пополнения. Цель обуславливает постановку ряда задач:
1. сравнительный анализ выразительных возможностей языков представления знаний в онтологии InTez и OWL2
2. разработка средств конвертирования
3. разработка метода контроля результатов.
Для решения указанных задач необходимо выполнить следующее:
· Изучение основ работы с онтологией InTez и структуры хранения данных в ней
· Обзор основных конструкций унифицированного языка онтологий OWL 2
· Изучение способов построения онтологий на OWL 2
· Разработка программы конвертирования онтологии InTez в формат OWL 2
· Сравнение семантических резонеров (Semantic reasoner) и их возможностей
· Проверка результатов с помощью семантического резонера
Первая глава данной работы носит повествовательный характер. Задачами первой главы были произвести оценку выразительных возможностей языка описания онтологий OWL, Обзор основных конструкций унифицированного языка онтологий OWL 2.
Вторая глава так же носит повествовательный характер. Задачами первой главы были Изучение основ работы с онтологией InTez и структуры хранения данных в ней, оценка выразительных возможностей языка онтологии InTez.
Третья глава посвящена сравнительному анализу выразительных возможностей языков представления знаний в онтологии InTez и OWL2 и разработке программы конвертирования данных из онтологии InTez на унифицированный язык описания онтологий OWL.
Четвертая глава посвящена обзору семантических резонеров и проверке выходных данных, полученных в ходе конвертирования.
Практическая значимость данной работы заключается в том, что количество онтологий постоянно увеличивается, и данные некоторых них могут повторяться, онтологиям рекомендуется иметь возможность импорта и экспорта данных на унифицированный язык онтологий OWL. Если данная возможность появится в InTez, то InTez станет более открытой и сможет обмениваться данными с другими онтологиями и получит возможность проверки корректности данных в других онторедакторах, которые имеют поддержку языка OWL.
Результатами работы являются программа конвертирования данных из онтологии InTez в формат OWL. Так же важным результатом стало то, что при проверке конвертированных данных было обнаружено несколько ошибок в исходной онтологии и в системе ввода данных в онтологию, из-за чего количество ошибок могло бы сильно возрасти в дальнейшем. Т. к. ошибки были найдены, данные в онтологии были оперативно исправлены, была исправлена уязвимость, найденная в системе ввода и на данный момент данные онтологии InTez конвертированные в формат OWL не имеют логических ошибок.
Были произведены сравнение семантических резонеров и обзор их возможностей. Так же был произведен обзор онтологического редактора Protégé, его функциональных возможностей. Вследствие этого получилось найти удобный способ проверки корректности данных онтологии InTez и корректность конвертирования этих данных на язык OWL.
В связи с этим цель – разработка конвертора, обеспечивающая экспорт данных из онтологии InTez в формат OWL была выполнена.


