УДК 004:378 © САДАНОВА Б. М., КОГАЙ Г. Д., ТОМИЛОВА Н. И., ТАЙЛАК Б. Е., 2011
ПРИМЕНЕНИЕ ОНТОЛОГИЧЕСКОГО МОДЕЛИРОВАНИЯ В ЭЛЕКТРОННОМ ОБУЧЕНИИ
САДАНОВА Б. М., старший преподаватель,
КОГАЙ Г. Д., к. т.н., профессор,
ТОМИЛОВА Н. И., к. т.н., доцент,
ТАЙЛАК Б. Е., старший преподаватель,
Карагандинский государственный технический университет
Статья посвящена описанию технологии организации электронного обучения с использованием методологии Semantic Web. Для организации работы с разнотипной и распределенной информацией и данными предлагается использовать онтологическое моделирование. Приводится описание структуры онтологической модели системы управления знаниями. Совокупность описаний онтологической модели и метаданных всех ресурсов системы составляют онтологическую базу знаний системы. Распределенная база знаний ресурсного центра, объединяющего разнородную информацию, структурирована с помощью редактора онтологий Protege 3.2. Приводится перечень программных средств, используемых для реализации системы.
Ключевые слова: электронное обучение, онтологии, семантические технологии, системы управления знаниями, метаданные, модель знаний.
Современные информационные технологии коренным образом меняют все основные процессы деятельности человека, включая образование. Внедрение сетевых компьютерных технологий и систем управления знаниями ускоряет коммуникации людей в процессе решения общих задач, упрощает доступ к информационным ресурсам для повышения профессиональной квалификации, улучшает качество принимаемых решений. Знания накапливаются на информационных серверах баз данных с удаленным доступом в сетях Интернет и активно применяются в процессе обучения на базе автоматизированных информационных систем и технологий управления знаниями.
Одним из основных приемов, который используется в технологиях управления знаниями, является создание единого информационного образовательного пространства с единой точкой входа на базе корпоративных порталов и хранилищ данных на основе многоуровневых Web-приложений и динамических SQL-баз данных.
В основе открытого образования лежит некоторая распределенная или виртуальная образовательная среда, в которой учащийся должен ориентироваться самостоятельно, стремясь к достижению стоящих перед ним образовательных целей. При этом задача преподавания дисциплин в новых условиях сводится к соединению творческих усилий преподавателей, выступающих большей частью в роли консультантов, и обучающихся в процессе постановки и реализации учебных целей и программ. Информационная образовательная среда предполагает наличие распределенного, реализованного в сетевой среде хранилища информационных образовательных ресурсов, или депозитария информационных образовательных ресурсов, для различных категорий пользователей независимо от места их расположения.
В настоящее время во всем мире ведутся работы по исследованию и разработке распределенных обучающих систем. Основные направления этих исследований:
· создание новых форм представления и способов хранения знаний, стратегий активации и использования этих знаний;
· разработка формальных и когнитивных моделей приобретения знаний;
· формирований моделей поведения обучаемых;
· создание новых стратегий обучения студентов и изучения учебного материала.
Основу компонентного конфигурирования процесса (сценария) обучения в виртуальной образовательной среде составляет создание и использование интегрированного пространства знаний (ИПЗ), объединяющего знания смежных научных дисциплин на основе принципов построения систем управления знаниями. ИПЗ обеспечивает интеграцию, накопление и поддержку, а также организацию доступа к знаниям виртуальной образовательной среды, что позволяет:
· объединить разрозненные источники информации по различным
дисциплинам, специальностям и участникам образовательного
процесса (преподавателям и студентам) в рамках единой системы;
· обеспечить постоянное развитие системы за счет обновления теоретического знания и непрерывного накопления нового опыта, полученного преподавателями и студентами в ходе учебного процесса;
· предоставлять релевантную решаемой обучающей задаче информацию каждому из участников образовательного процесса в соответствии с его знаниями, предпочтениями и потребностями.
Развитие информационного обеспечения на основе Web-платформы привело к созданию технологических новшеств, таких как:
- AJAX - асинхронный JavaScript и XML - это подход к построению интерактивных пользовательских интерфейсов веб-приложений. При использовании AJAX веб-страница не перезагружается полностью в ответ на каждое действие пользователя. Такой подход позволяет создавать намного более удобные веб-интерфейсы, которые можно наблюдать и в почте Gmail, и в разнообразии современных поисковых систем – , и т. д.
- Открытые общественные Web-сервисы API — наборы методов, который программист может использовать для доступа к функциям других программ. Открытость API позволяет любому желающему создавать смешанные (mash-up) гибридные сервисы, которые предоставляют пользователям дополнительные возможности.
- Web-синдикация RSS (RDF Rich Site Summary - обогащенная аннотация сайта). С точки зрения пользователя, подобное описание – это некоторая аннотация, резюме к материалам, опубликованным на сайте. Эта аннотация оформлена специальным образом: информация, содержащаяся в ней, формально описана, что позволяет использовать автоматические средства обработки. Можно сказать, что RSS – это всего лишь формат, в котором удобно публиковать краткую информацию, в первую очередь часто обновляемую. Это могут быть новости, личные электронные дневники и другие веб-сайты с динамично изменяющимся контентом.
С точки зрения RSS, контент состоит из одного или нескольких каналов (channels). В свою очередь канал состоит из одного или нескольких пунктов (items). Канал и пункт канала содержат метаданые, то есть данные о контенте. Поскольку RSS ориентирован на аннотирование контента, то наиболее важными метаданными являются заголовок и URL с ссылкой на контент. Но в зависимости от версии RSS допускаются и другие виды метаданных, вплоть до изображений и гипертекста. Развитие социальных сервисов влияет на различные области учебной деятельности. Можно выделить следующие последствия развития сервисов Web 3.0:
1. В результате распространения социальных сервисов в сетевом доступе оказывается огромное количество открытых материалов, которые могут быть использованы в учебных целях. Сетевые сообщества обмена знаниями могут поделиться своими коллекциями цифровых объектов и программными агентами с образованием.
2. Новые сервисы социального обеспечения радикально упростили процесс создания материалов и публикации их в сети. Теперь каждый может не только получить доступ к цифровым коллекциям, но и принять участие в формировании собственного сетевого контента.
3. Среда информационных приложений открывает принципиально новые возможности для деятельности, которая связана как с поиском в сети информации, так и с созданием и редактированием собственных цифровых объектов – текстов, программ, видеофрагментов.
4. Сеть Интернет открывает новые возможности для участия студентов в профессиональных научных и бизнес сообществах.
Одним из главных требований к образовательным сетевым системам является обеспечение высокого уровня интероперабельности (interoperable), то есть возможности взаимодействия с другими различными системами, что крайне важно при создании распределенных учебных сред в Intranet/Internet сетях. Большинство из них реализует это требование за счет открытости интерфейсов доступа к своим сервисам и/или путем использования единого формата для обмена данными, а именно XML и связанной с ним объектной модели представления документов DOM (Document Object Model), осуществляя, если необходимо, XSL-преобразования. Такой подход позволяет решить задачу синтаксической интероперабельности. К сожалению, для организации взаимодействия между различными образовательными системами в Intranet/Internet сетях в большинстве случаев недостаточно обеспечения только синтаксической интероперабельности. Это обусловлено прежде всего, тем что одну и ту же информацию можно синтаксически по-разному представить, и, как следствие может возникнуть естественный барьер между системами. На сегодняшний день практически не существует образовательных систем решающих эту задачу за счет использования единого представления данных предметной области, а именно, используя единый словарь (таксономию) с описаниями используемых данных (онтологию). Под онтологией понимается совокупность концепций, объектов, их свойств, отношений и ограничений, выражающих семантику определенного приложения. К объектам онтологии относятся понятия предметной области, которые представлены терминами (словами или словосочетаниями). Онтологии соответствуют тезаурус, состоящий из терминов и определений понятий в виде гипертекста, и семантическая сеть, вершины которой соответствуют понятиям, а связи — отношениям между понятиями.
Тезаурус имеет иерархическую структуру. Целесообразно выделять уровни дисциплин, разделов дисциплин, их подразделов и элементов. Элемент — это запись, включающая термин и его краткое определение.
Проблема отсутствия четких семантических определений мешает объединению образовательных систем различных производителей. После составления такого словаря для представления данных предметной области можно с легкостью использовать язык web-онтологий OWL (Ontology Web Language), который является одним из самых последних разработок консорциума W3C в направлении Semantic Web для организации высокого уровня синтаксической и семантической способности приложений к взаимодействию.
Для разработки системы управления знаниями в дистанционном обучении предлагается использовать распределенную базу знаний ресурсного центра, объединяющего разнородную информацию, структурированную с помощью редактора онтологий Protege 3.2. Запросы выполняются на языке SPARQL к RDF нотации этой онтологии. Структурирование учебного материала заключается в его разделении на модули. В состав системы входят следующие модули:
• информационный — база учебных материалов;
• инструментальный (авторский) — среда сопровождения;
• компилирующий — модуль синтеза новых учебных пособий;
• обучающий — модуль конечных пользователей;
• информационно-поисковый;
• диагностический.
Каждый модуль дополняется спецификацией, включающей интерфейсные и регистрационные атрибуты. Интерфейсные атрибуты служат для согласования данного модуля с другими модулями в составе компилируемых учебных пособий и включают списки терминов, специфичных для данной предметной области и используемых символических обозначений величин. Особо выделяются термины и понятия, определяемые в модуле. Примерами регистрационных атрибутов могут служить имена авторов модуля, даты внесения изменений, данные о сертификации модуля и т. п. Предлагается для описания интерфейсных и регистрационных атрибутов использовать средства семантической обработки данных и информации, основанные на технологиях Semantic Web.
Все информация и данные модулей системы содержатся во множестве разнообразных источников К (документы, файлы, базы данных, внешние ресурсы, на которые есть ссылки) К = {К', ... , Кп}. Для организации работы с разнотипной и распределенной информацией и данными предлагается использовать онтологическое моделирование. Под онтологической моделью (онтологией) О в данной статье понимается знаковая система (С, Т, Р, F, L, А), где С - множество элементов, которые называются понятиями; Т - частичный порядок на множестве С, задающий отношения «подкласс» и «суперкласс»; Р - множество элементов, которые называются свойствами (двуместными предикатами); F - функция, которая назначает каждому элементу множества Р множество элементов из множества С (с учетом их иерархии в Т) , к которым оно применимо (область действия, domain) и множество элементов из множества С или литералов (экземпляров примитивных типов, таких как строки и числа), которые могут быть их значениями (область возможных значений, интервал, range); L={ Lc, Lp, αC, αP} - множество текстовых меток, которые определяют профессиональные термины организации и их соответствие, соответствие αC - элементам множества С, αP - элементам множества P, А - набор аксиом онтологии - утверждения об элементах предметной области, которые считаются верными, выраженных с использованием соответствующего логического языка.
Создание единой онтологии для детального описания модели знаний является весьма трудоемкой задачей. Для решения задачи построения онтологии системы управления знаниями предлагается использовать онтологическую модель следующей структуры: О = { Оо, Ор, Оз}, где Оо - онтология организации, Ор - онтология информационных ресурсов, а Оз = {О1, О2,…,От} - иерархически организованная, последовательно расширяемая система онтологий основных областей знаний О, значимых для работы системы. Выделение иерархии областей знаний дает возможность создавать отдельно онтологии разных подобластей знаний, которые могут иметь разную детальность, в зависимости от потребностей их моделирования.
На основе такой онтологической модели знаний О, описание ресурса (объекта) Ri может быть представлено в виде набора семантических метаданных следующей структуры Мi = (Мкi (О), Мсi(О)), где Мкi (О) - это контекстные метаданные объекта знаний, описывающие взаимосвязи объекта с другими объектами и понятиями организации или литералами, а Мсi(О) - контентные метаданные ресурса, описывающие информацию, которая содержатся в объекте. Контекстные метаданные соответствуют набору значений свойств понятия сj С, экземпляром которого является описываемый объект в онтологии организации, т. е. Мкi (О)= (р1(Oi, υ1)
р2(Oi, υ2)
...
рr(Oi, υr)), где утверждение рi(Oi, υi) состоит из предиката (отношения) рi Р, описанного в онтологии организации, URI (универсальный идентификатор ресурса) описываемого объекта Оi, для которого определяются метаданные и значения υi, которое может быть либо URI некоторого экземпляра понятий онтологии организации, либо некоторый литерал (текст, число, дата) в соответствии с областью действии и областями возможных значений свойства рi. Контентные метаданные Мсi(О) описываются наборами утверждений из Оз, т. е. семантические метаданные объектов знаний описываются отношениями и понятиями из онтологий основных предметных областей знаний организации в виде набора кортежей: Мсi (О) = ({р1(S1, υ1), к1}
{ р2(S2, υ2), к2}
...
{ рk(Sk, υk), кk}), где {рi(Si, υi), кi} - кортеж, включающий утверждение рi(Si, υi) (соответствующее RGF - триплету (Si,рi,υi) и кi - важность данного утверждения для описания контента объекта знаний i.
Совокупность описаний онтологической модели и метаданных всех ресурсов системы составляют онтологическую базу знаний системы.
Для построения интерфейса между машиной логического вывода и студентом используется система управления контентом (CMS), которая создает удобный WEB-интерфейс для работы с учебным материалом. Для реализации машины логического вывода был выбран набор библиотек Jena - интеллектуальное средство логического вывода для связи разработанных онтологий с пользовательскими интерфейсами в областях знаний, где требуется логическая обработка больших массивов данных.
Поиск знаний в онтологиях производится средствами поисковой системы Lucene Nutch. Nutch API - программный интерфейс поисковой системы, позволяющий интегрировать поисковую систему с другими приложениями. Управление контентом осуществляется с помощью Joomla – системы управления контентом, которая обеспечивает быстрое создание WEB-страниц, редактирование их содержимого, экспорт новостей в форматах RSS, ATOM.
Основной отличительной особенностью системы является динамическое построение внешнего вида и основных компонентов (тематических модулей). Построение дизайна и вывод основных тематических модулей, на которых строится практически весь пользовательский интерфейс портала, происходит на стороне сервера посредством выборки необходимых данных из базы данных MySQL.
ЛИТЕРАТУРА
1. , Хорошевский знаний интеллектуальных систем. СПб.: Питер, 2001.
2. W3C, “RDF/XML Syntax Specification (Revised),” http://www. w3.org/TR/rdf-syntax-grammar/
3. Тузовский Информации и Данных Организации с Использованием Онтологических Моделей и Семантических Методов.// Материалы Всероссийской конференции с международным участием «Знания-Онтологии-Теория» - 2007.- Т.1 - С. 45-53
4. http://www. intuit. ru/department/expert/ontoth73/
, , , қ
Бап Semantic Web электрондық үйренудi ұйымның технологиясының сипаттамасына әдiстемелiктi қолданып арналған. Жұмысты ұйымдастырулар әртүрлi және таралған мәлiметпен және мәлiметтермен үшiн онтологиялық пiшiндеудi қолданылуға ұсынылады.
B. M.Sadanova, G. D.Kogai, N. I.Tomilova, B. E.Tailak
The article is sanctified to description of technology of e-learning organization using Semantic Web methodology. Ontological design is offered to use for organization work with different and up-diffused information and data.
СВЕДЕНИЯ ОБ АВТОРАХ:
Саданова Бакытгуль Маратовна – старший преподаватель кафедры «Вычислительная техника и программное обеспечение» КарГТУ. В 1992 году с отличием закончила КПТИ по специальности «Автоматизированные системы обработки информации и управления». Автор 3 монографий, а также более 20 научных и учебно-методических работ. Область научных интересов – разработка интеллектуальных систем на основе семантических Web-технологий.
- зав. кафедрой «Вычислительная техника и программное обеспечение» КарГТУ, кандидат технических наук, профессор, член-корреспондент Международной Академии информатизации Казахстана. Имеет 162 печатных труда, в том числе монографии, учебные пособия, электронные учебники, слайд-лекции, видео-лекции, мультимедийные презентации. Научные направления: компьютерные технологии, область информатизации и автоматизации информационных систем, инновационные, информационные и IT технологии.
, кандидат технических наук, доцент кафедры Вычислительной техники и программного обеспечения КарГТУ. Область научных интересов: информационные технологии в области энергетики. В соавторстве были разработаны и изданы более 30 научных и учебно-методических работ.
Тайлак Бибигуль Елжасовна в 1994 году закончила КПТИ по специальности «Автоматизированные системы обработки информации и управления». Работает старшим преподавателем кафедры «Вычислительная техника и программное обеспечение». Опубликовано свыше 15 научных трудов.


