Лабораторная работа №4

1. Работа с полнотекстовым индексом

1.1 Создать таблицу с url файлов указанного типа.

Бригада

Вариант

1,6,7,8,13

doc, docx

2,4,9,12,14

HTML

3,5,11,10,15,16

PDF


Количество файлов не менее 10, язык английский.

1.2 Задать стоп-список слов, из слов, встречающихся в одном из файлов.

Бригада

Количество слов

1,4,7,9,10,16

2

3,5,8,11,15

5

2,6,12,13,14

4


1.3 Построить полнотекстовый индекс.

Привести размер таблиц, используемых для хранения данных индекса. Сравнить с объемом индексируемых файлов.

1.4 Выполнить запрос к таблице проиндексированных документов  со следующим условием

Бригада

Вариант

1,7,8,16

Документ должен включать как минимум одно из четырех указанных слов и не быть похожим по звучанию  на пятое.

4,3,9,12

Документ должен включать похожие по звучанию слова для всех трех указанных.

5,11,10,15

Документ должен включать как минимум одно из двух указанных слов и  однокоренные слова  для двух других указанных слов.

2,6,9,13

Документ не должен включать ни похожие по звучанию, ни однокоренные для трех приведенных


Подобрать такой набор поисковых слов, чтобы результат выполнения  включал как минимум несколько записей. Привести значение релевантности найденных записей.

Привести результаты, статистику выполнения, план выполнения запроса и план выполнения поиска по созданному  индексу.

1.5 Выполнить запрос, условие которого включают  только слова из стоп-списка, привести результат выполнения.

2. Работа с XML

2.1 Для одного из запросов из л. р. №1 выполнить построение XML-документов, используя  следующие инструменты

Бригада

Количество слов

1,2,4,7,9,10,12,16

DBMS_XMLGEN

3,5,6,8,11,13,14,15

XMLROOT, XMLELEMENT, XMLAttributes

Привести полученный XML-документ.

Указание к выполнению

Для индексирования разнотипных файлов по url хранящихся в столбце таблицы, перед построением индекса необходимо выполнить:

begin

ctx_ddl. create_preference('URL_PREF','URL_DATASTORE');

ctx_ddl. set_attribute('URL_PREF','Timeout','300');

end;

Индекс необходимо создавать на столбце с url, и при создании указать:

create index datastores_text on  таблица (столбец )  indextype is ctxsys. context parameters ( 'Datastore URL_PREF  filter CTXSYS. AUTO_FILTER section group CTXSYS. AUTO_SECTION_GROUP  прочие параметры' );

Информация об остальных операциях с полнотекстовыми индексами приведена в лекции №4.