Лабораторная работа №4
1. Работа с полнотекстовым индексом
1.1 Создать таблицу с url файлов указанного типа.
Бригада | Вариант |
1,6,7,8,13 | doc, docx |
2,4,9,12,14 | HTML |
3,5,11,10,15,16 |
Количество файлов не менее 10, язык английский.
1.2 Задать стоп-список слов, из слов, встречающихся в одном из файлов.
Бригада | Количество слов |
1,4,7,9,10,16 | 2 |
3,5,8,11,15 | 5 |
2,6,12,13,14 | 4 |
1.3 Построить полнотекстовый индекс.
Привести размер таблиц, используемых для хранения данных индекса. Сравнить с объемом индексируемых файлов.
1.4 Выполнить запрос к таблице проиндексированных документов со следующим условием
Бригада | Вариант |
1,7,8,16 | Документ должен включать как минимум одно из четырех указанных слов и не быть похожим по звучанию на пятое. |
4,3,9,12 | Документ должен включать похожие по звучанию слова для всех трех указанных. |
5,11,10,15 | Документ должен включать как минимум одно из двух указанных слов и однокоренные слова для двух других указанных слов. |
2,6,9,13 | Документ не должен включать ни похожие по звучанию, ни однокоренные для трех приведенных |
Подобрать такой набор поисковых слов, чтобы результат выполнения включал как минимум несколько записей. Привести значение релевантности найденных записей.
Привести результаты, статистику выполнения, план выполнения запроса и план выполнения поиска по созданному индексу.
1.5 Выполнить запрос, условие которого включают только слова из стоп-списка, привести результат выполнения.
2. Работа с XML
2.1 Для одного из запросов из л. р. №1 выполнить построение XML-документов, используя следующие инструменты
Бригада | Количество слов |
1,2,4,7,9,10,12,16 | DBMS_XMLGEN |
3,5,6,8,11,13,14,15 | XMLROOT, XMLELEMENT, XMLAttributes |
Привести полученный XML-документ.
Указание к выполнению
Для индексирования разнотипных файлов по url хранящихся в столбце таблицы, перед построением индекса необходимо выполнить:
begin
ctx_ddl. create_preference('URL_PREF','URL_DATASTORE');
ctx_ddl. set_attribute('URL_PREF','Timeout','300');
end;
Индекс необходимо создавать на столбце с url, и при создании указать:
create index datastores_text on таблица (столбец ) indextype is ctxsys. context parameters ( 'Datastore URL_PREF filter CTXSYS. AUTO_FILTER section group CTXSYS. AUTO_SECTION_GROUP прочие параметры' );
Информация об остальных операциях с полнотекстовыми индексами приведена в лекции №4.


