Основой систематизации документов в большинстве нормативно-правовых баз данных является многоуровневый классификатор, разработанный на основе Общеправового классификатора отраслей законодательства, утвержденный Указом Президента РФ от 16.12.93 № 000. Классификатор построен по иерархическому принципу: все тематики разбиты на крупные блоки, которые могут иметь еще несколько уровней вложения.
Для лучшего отражения предметной области (высшая школа) требуется доработка лингвистического обеспечения информационной системы и включение его в одну из оболочек существующих нормативно-правовых информационных систем. Основными лингвистическими средствами являются рубрикаторы и тезаурусы.
Предлагается доработать лингвистическое обеспечение в части создания тематического рубрикатора по высшему образованию.
Сложность реализации включения нового тематического рубрикатора состоит в том, что современные нормативно-правовые системы не предусматривают перенос классификаторов из одной системы в другую. Для решения этой задачи необходимо выбрать программно-информационный комплекс, реализующий механизмы включения тематического рубрикатора в оболочку базы данных.
В результате проведенного анализа для создания и ведения нормативно-правовой базы данных по высшему образованию выбраны нормативно-правовая база данных Эталон, а также программные комплексы создания базы данных, администратора и регистрации пользователя.
Этот программно-информационный комплекс позволяет создавать предметно-ориентированную базу данных нормативно-правовой информации с развитыми средствами поиска информации, встраивать новый тематический рубрикатор, актуализировать информацию, создавать дистрибутив и регистрировать базу данных.
Во второй главе «Метод построения тематического рубрикатора» рассматривается проблема выбора лингвистического обеспечения, разработки тематического рубрикатора по высшему образованию и механизма включения его в базу данных по высшему образованию.
База данных Эталон обладает развитой системой лингвистического обеспечения. Она включает банк юридических терминов, автоматизированный комплексный юридический словарь, сравнительный словарь терминов, словари различного рода наименований, словари сокращений, а также разделы общеправового классификатора отраслей законодательства, классификатор и тематический перечень правовых аспектов. Однако все перечисленные средства недостаточны для индексирования документов и получения релевантной выборки документов, связанных с проблемами образования.
Проведен анализ основных характеристик существующих лингвистических средств, в том числе отраслевого рубрикатора “Высшее образование. Педагогика высшей школы”, включенного в Государственную автоматизированную систему научно-технической информации. Определены пути необходимой доработки существующих лингвистических средств. Разработаны требования к ведомственным тематическим рубрикаторам. Рассмотрены механизмы включения ведомственных рубрикаторов в нормативно-правовые системы.
Исследованы особенности создания лингвистического обеспечения на основе тезауруса или рубрикатора.
Стандарт ISO определяет тезаурус, как набор терминов, связанных между собою соответствующими связями или отношениями (рис. 2).

Рис. 2. Структура тезауруса
Классификатор – множество сущностей, разделенное по определенным признакам на некоторое число классов, сгруппированных вместе. Фрагмент общероссийского классификатора специальностей по образованию приведен в таблице 2.
Рубрикатор представляет собой иерархическую классификационную систему с универсальным тематическим охватом предметной области.
Показана целесообразность создания тематического рубрикатора по высшему образованию и предложен подход к его разработке на основе нескольких рубрикаторов. Формализация процесса формирования рубрикатора по высшему образованию выполнена на базе теоретико-логического и теоретико-множественного подходов. Определены требования к рубрикатору по высшему образованию и предложена методика его разработки.
Таблица 2
Фрагмент общероссийского классификатора специальностей по образованию
Код | Наименования групп, направлений, специальностей | Квалификация | Код МСКО | |
010000 | ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ | |||
010400 | Прикладная математика и информатика | |||
Бакалавр прикладной математики и информатики | 5А481 | |||
Магистр прикладной математики и информатики | 5А481 | |||
010401 | Прикладная математика и информатика | |||
Математик, системный программист | 5А481 | |||
В качестве исходных данных используются следующие рубрикаторы, наиболее полно отражающие систему образования:
- отраслевой рубрикатор «Высшее образование. Педагогика высшей школы»;
- рубрикатор системы Гарант;
- рубрикатор системы КонсультантПлюс;
- рубрикатор системы Эталон;
- тематические подборки по высшему образованию.
В качестве приоритетного выбирается рубрикатор «Высшее образование. Педагогика высшей школы», описывающий рубрики в терминах предметной области. Для формирования рубрикатора по высшему образованию рубрики этого рубрикатора сравниваются с рубриками рубрикаторов системы Гарант и системы КонсультантПлюс. При этом используются следующие правила.
Рубрика включается в рубрикатор по высшему образованию, если:
рубрика присутствует во всех трех рубрикаторах;
рубрика присутствует в отраслевом рубрикаторе «Высшее образование. Педагогика высшей школы» и в одном из рубрикаторов системы Гарант или системы КонсультантПлюс;
рубрика присутствует в рубрикаторе системы Гарант и системы КонсультантПлюс.
Если рубрика присутствует только в отраслевом рубрикаторе «Высшее образование. Педагогика высшей школы», то решение о включении ее в рубрикатор принимают эксперты.
Логические правила включения рубрик в тематический рубрикатор по высшему образованию представлены в таблице 3.
Здесь:
1 − наличие рубрики в рубрикаторе;
0 − отсутствие рубрики в рубрикаторе.
Таблица 3.
Правила формирования рубрикатора
№ логиче-ского правила | Отраслевой рубрикатор «Высшее образование. Педагогика высшей школы» | Рубрикатор системы Гарант | Рубрикатор системы КонсультантПлюс | Тематический рубрикатор по высшему образованию |
A | B | C | D | |
1 | 1 | 1 | 1 | 1 |
2 | 1 | 1 | 0 | 1 |
3 | 1 | 0 | 1 | 1 |
4 | 1 | 0 | 0 | 1/0 [1] |
5 | 0 | 1 | 1 | 1 |
6 | 0 | 1 | 0 | 0 |
7 | 0 | 0 | 1 | 0 |
8 | 0 | 0 | 0 | 0 |
Введем обозначения:
A − рубрика принадлежит отраслевому рубрикатору «Высшее образование. Педагогика высшей школы»;
B − рубрика принадлежит рубрикатору Гарант;
C − рубрика принадлежит рубрикатору КонсультантПлюс;
D – рубрика принадлежит тематическому рубрикатору.
Как показано в диссертации, любая таблично заданная функция алгебры логики может быть представлена аналитически в виде функции, объединяющей все термы, равные единице.
Для описания правил формирования рубрикатора можно использовать теоретико-множественный подход.
Введем следующие обозначения множеств:
− множество значений рубрик отраслевого рубрикатора «Высшее образование. Педагогика высшей школы»;
− текущее значение рубрики,
.
− множество значений рубрик рубрикатора Гарант;
− текущее значение рубрики,
.
− множество значений рубрик рубрикатора КонсультантПлюс;
− текущее значение рубрики,
.
− множество значений рубрик для экспертизы;
− текущее значение рубрики,
.
− множество значений рубрик формируемого тематического рубрикатора;
− текущее значение рубрики тематического рубрикатора,
.
При этом правила формирования рубрикатора можно записать следующим образом.
1. Любой элемент, который принадлежит пересечению множеств A, B, C, включается в D.
2. Любой элемент, который принадлежит пересечению множеств A, B, включается в D.
3. Любой элемент, который принадлежит пересечению множеств A, C, включается в D.
4. Любой элемент, который принадлежит только множеству A, отправляется на экспертизу.
5. Любой элемент, который принадлежит пересечению множеств B, C, включается в D.
6. Любой элемент, который принадлежит только множеству B, не включается в D.
7. Любой элемент, который принадлежит только множеству C, не включается в D.
8. Любой элемент, который не принадлежит ни одному из множеств A, B, C, не включается в D.
Правила (1, 2, 3, 5) могут быть представлены в виде:
.
Правила (6, 7, 8) могут быть представлены в виде:
.
Правило 4 может быть представлено в виде:
.
Разработан также обобщенный алгоритм формирования тематического рубрикатора, который реализует типовой метод формирования рубрикатора, и состоит из следующих шагов (рис. 3).
1. Ввод исходных данных.
2. Последовательное сравнение рубрик рубрикаторов.
3. Формирование множества рубрик для экспертизы
4. Просмотр экспертом рубрик множества
и принятие решения о включении рубрики
в тематический рубрикатор
.
5. Формирование тематического рубрикатора.
При этом реализуется функция объединения множеств, полученных в результате последовательного сравнения рубрик основного рубрикатора
с рубриками всех введенных рубрикаторов
,…
, сравнения между собой рубрик рубрикаторов
,
, а также рубрик
, включаемых на основании экспертизы множества
.
В результате создается линеаризованный рубрикатор, представляющий собой множество рубрик по высшему образованию.
Дополнение сформированного рубрикатора рубриками возможно на основании анализа тематических подборок, которые содержат документы востребованные пользователями.
В третьей главе «Концепция построения модели базы данных нормативно-правовой информации высшего образования» рассмотрены вопросы моделирования характеристик поиска в базе данных.
Эффективность функционирования базы данных в основном зависит от структуры тезауруса и характеристик поиска.

Рис. 3. Алгоритм формирования тематического рубрикатора
Целью моделирования является изучение взаимных влияний изменения структуры тезауруса на характеристики поиска. Структура тезауруса определяется рубрикатором, характеризующимся количеством рубрик, количеством уровней, количеством элементов на последнем уровне рубрикатора, а также словарем синонимов, словарем определений и словарем омонимов. В качестве характеристик поиска рассматриваются полнота поиска, точность поиска и продолжительность поиска.
Для решения этой задачи предложена когнитивная модель в виде ориентированного графа (рис. 4.).
Рассматривается влияние варьирования факторов и возмущающих воздействий на характеристики поиска для двух вариантов модели. В первом варианте в моделе исключаются вершины, определяющие следующие факторы: Словарь синонимов, Словарь определений и Словарь омонимов. Во втором варианте модель учитывает все факторы, представленные на рис. 4.

Рис. 4. Модель влияния характеристик структуры тезауруса
на характеристики поиска
В первом варианте на 0-м шаге на фактор Количество рубрик последовательно вводятся возмущающие воздействия величиной (+30), (+50) и (+100). Задается число шагов моделирования, равное 10. Производится расчет модели.
Модель отражает тенденцию изменения факторов во времени в зависимости от величины возмущающего воздействия.
Графики результатов расчета модели при возмущающем воздействия величиной (+50) представлены на рис. 5.
Рассматриваются результаты расчетов альтернативных вариантов изменения количества рубрик рубрикатора. Проводится сравнительный анализ значений амплитуд факторов альтернативных вариантов при достижении устойчивости системы по Лагранжу. Увеличение количества рубрик приводит к увеличению точности поиска и одновременному уменьшению полноты поиска.
Известно, что при увеличении точности поиска уменьшается полнота поиска. Наиболее целесообразным количеством уровней в рубрикаторе является 1 – 3, а количество рубрик на каждом уровне – не более семи. Из этого следует, что при трехуровневом рубрикаторе количество рубрик не превышает 50.

Рис. 5. Графическое представление результатов изменения всех параметров.
Для улучшения характеристик поиска и увеличения полноты поиска рассматривается второй вариант модели при возмущающем воздействия величиной (+50), при котором в модель вводятся словарь синонимов, словарь определений понятий, словарь омонимов (рис. 6.).

Рис. 6. Графики результатов расчета модели с добавлением вершин
При одинаковой структуре рубрикатора включение факторов Словарь синонимов, Словарь определений понятий и Словарь омонимов приводит к некоторому увеличению полноты поиска, уменьшению продолжительности поиска и улучшению характеристик поиска. Однако следует отметить, что разработка и включение тезауруса в базу данных является дорогостоящим и трудоемким процессом.
В четвертой главе «Технология формирования базы данных нормативно-правовой информации» предложены информационно-технологические средства, которые обеспечивают создание нормативно-правовой базы данных по высшему образованию, а также формирование тематических подборок по конкретным проблемам образования.
Для создания базы данных по образованию предлагается использовать комплекс программных средств, включающий нормативно-правовую базу данных Эталон, программный комплекс создания базы данных, программный комплекс администратора и программный комплекс регистрации пользователя (рис. 7, рис. 8). Двойными линиями показаны информационные потоки.

Рис. 7. Формирование базы данных

Рис. 8. Функциональная схема формирования базы данных
Создание базы данных по образованию включает несколько этапов.
1. В базе данных Эталон выбираются документы согласно перечню, определенному пользователем, путем задания ряда реквизитов, ключевых слов и словосочетаний.
2. Формируется список документов.
3. Проводится предварительная обработка документов для согласования форматов базы данных Эталон и программных комплексов создания базы данных, администратора, регистрации пользователя и привязка документов к соответствующим рубрикам разработанного тематического рубрикатора по высшему образованию с помощью юриста.
4. Проводится подготовка базы данных к загрузке. Копируются все исполняемые файлы базы данных Эталон (оболочка) за исключением файла документов.
5. Формируется дистрибутив базы данных по проблеме образования для передачи пользователю.
6. Проводится регистрация нормативно-правовой локальной базы данных по проблеме образования и присвоение имени и пароля.
Предложенная технология формирования базы данных по проблеме образования отработана на выборке нормативно-правовых документов по обеспечению Федеральной программы развития образования (ФПРО) в России.
Для структурирования данных нормативно-правовой информации предложена технология формирования тематических подборок (рис. 9), включающая несколько этапов.
1. Определяются количество и структура вложенных тематических папок, отражающих содержание документов по конкретной проблеме образования, и их распределение по следующим видам нормативно-правовых актов: законодательные акты, подзаконные акты, распорядительная документация.
2. Выполняется поиск документов в нормативно-правовой базе данных Эталон в соответствии с составленными запросами.
3. В отобранных документах, используя списки ключевых слов и словосочетаний, определяемых пользователем, выделяются фрагменты текстов, относящиеся к области образования.
Материалы в папках могут быть представлены как: полнотекстовый документ; полнотекстовый документ, содержащий закладки, которые помечают фрагменты текстов по данной проблеме; фрагменты текстов, содержащие названия документов, ссылки на изменяющие документы, названия глав (разделов) документа, название статей, полные тексты пунктов, отражающих проблему.
Кроме того, формируются технологические папки, предназначенные для актуализации отобранных документов.
4. В тематических папках формируются реестр нормативно-правовых документов по данной проблеме, документы и фрагменты документов, а также запросы.
Сформированная система вложенных папок позволяет пользователю на первом этапе анализа просматривать реестры отобранных нормативно-правовых документов, уточнять их, составлять новые реестры по другим поисковым признакам. На втором этапе анализа она позволяет осуществлять содержательный анализ правоотношений в документах. Так как нормативно-правовая база данных Эталон периодически обновляется, то имеется возможность периодически формировать актуализированные реестры документов.

![]()
![]()
|
|




|
|
БД Эталон . … …
![]()
![]()
![]()
![]()
![]()
|
|
![]() |
Рис. 9. Формирование тематических подборок
по проблемам образования
В результате логико-семантического и информационно-смыслового анализа на магнитном носителе сформированы тематические подборки по проблемам ФПРО объемом свыше 2 мб.
В заключении подведен итог выполненных исследований и перечислены основные научные и практические результаты, полученные автором:
1. В результате анализа лингвистического обеспечения систем нормативно-правовой информации предложен метод ее структурирования в виде баз данных или вложенных электронных папок, содержащих тематические подборки нормативно-правовых документов.
2. Разработан программно – информационный комплекс средств для создания предметно-ориентированных нормативно-правовых баз данных.
3. Предложен метод выбора лингвистического обеспечения и разработки тематического рубрикатора, отражающего структуру предметно-ориентированной нормативно-правовой информации и использующего терминологию, сложившейся в этой предметной области. Разработана когнитивная модель влияния структуры тезауруса на характеристики поиска.
4. Создана технология функционирования программно-информационного комплекса для анализа и обработки нормативно-правовой информации по высшему образованию. Разработана методика формирования проблемно-ориентированных баз данных и ее адаптация к проблемам высшего образования.
5. Разработана технология формирования тематических подборок нормативно-правовых документов по комплексным проблемам высшего образования.
Основное содержание работы отражено в публикациях:
1. , , Шаров информационного поиска при формировании документа: Учебно-методическое пособие. - Часть 2. - М.: РАГС, 19с.
2. , Попова данных нормативно-правовой информации по среднему и высшему профессиональному образованию // Всероссийская конференция "Проблемы научно-методического и организационного обеспечения единого образовательного пространства": Тезисы докладов. - М., 1999. - C. 90-92.
3. , , Ремизова формирования локальной базы данных по правовым проблемам качества высшего профессионального образования // Всероссийская конференция "Проблемы научно-методического и организационного обеспечения единого образовательного пространства": Тезисы докладов. - М., 2001. - С. 90-92.
4. , ,. Ремизова средства в нормативно-правовых базах данных // Новые информационные технологии в образовании: Аналитические обзоры по основным направлениям развития высшего образования. - Вып. 11. - М.: Научно-исслед. ин-т высшего образования, 20с.
5. , , Сатунина состояние и развитие правовой информатизации высшей школы // Новые информационные технологии в образовании: Аналитические обзоры по основным направлениям развития высшего образования. - Вып. 5. - М.: Научно-исслед. ин-т высшего образования, 19с.
6. , , Сатунина обеспечение правовой информатизации в высшей школе // Новые информационные технологии в образовании: Аналитические обзоры по основным направлениям развития высшего образования. - Вып. 9. - М.: Научно-исслед. ин-т высшего образования, 20с.
7. , , Тарасов построения и способы использования современных правовых информационных систем: Учебное пособие. М.: Учебный центр НИИВО, 2000. – 16 c. Деп. № 85.
8. , , Тарасов информация в компьютерных технологиях. Программный комплекс ЮСИС, версия 7.4: полный обзор возможностей. - М.: Финансы и статистика, 19с.
9. , , и др. Анализ законодательства, регулирующего правоотношения в сфере образования. Часть 1. Под ред. // Новые информационные технологии в образовании: Аналитические обзоры по основным направлениям развития высшего образования. - Вып. 5. - М.: Научно-исслед. ин-т высшего образования, 20с.
10. , , и др. Анализ законодательства, регулирующего правоотношения в сфере образования. Часть 2. Под ред. // Новые информационные технологии в образовании: Аналитические обзоры по основным направлениям развития высшего образования. - Вып. 10. - М.: Научно-исслед. ин-т высшего образования, 2000. – 112 с.
11. Попова работы пользователя с информацией при коллективной подготовке документа сложной структуры по проблеме // Информационные технологии в структурах государственной службы: Сборник научных трудов. - Вып. 5. - М.: Изд-во РАГС, 2001. - С. 1-19.
12. , Митин построения тематического рубрикатора баз данных нормативно-правовой информации по образованию // Информационные технологии. № 8 –2007. - С. 76-79.
13. , , Попова -правовое обеспечение системы образования. Технология образования – требования времени. – М.: Изд-во ФИРО, 2007. - С. 24-54.
Автореферат
Диссертация на соискание ученой степени
кандидата технических наук
(Ф. И.О.)
Тема диссертационного исследования
Методика формирования
предметно-ориентированных баз данных
нормативно-правовой информации
Научный руководитель
(Ф. И.О.)
Изготовление оригинал-макета
(Ф. И.О.)
Подписано в печать____Тираж____экз.
Усл. п. л.____.
Российская академия государственной службы
при Президенте Российской Федерации
Отпечатано ОПМТ РАГС. Заказ №_____
Москва, пр-т Вернадского, д.84
[1] Решение о включении рубрики в рубрикатор по высшему образованию принимается экспертами.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 |



