Наиболее «закрытыми» среди указанных информационных ресурсов являются базы данных, интегрированные в Веб сайты. Здесь, как правило, доступ обеспечивается только с помощью заранее предусмотренных регламентированных запросов. Каждому такому запросу соответствует некоторая HTML-форма, представленная на интерфейсной странице системы базы данных. Пользователь задает параметры своего запроса, заполняя окна HTML-формы. Далее осуществляется проверка корректности заданных параметров, чаще всего с помощью встроенных в данную страницу программ-скриптов на языке JavaScript (см. п. 7.7). При обнаружеии ошибок пользователю выдается сообщение, и он может исправить значения ошибочных параметров. Далее они передаются на Веб-сервер, где с помощью специальной программы (скрипта) на их основе формируется SQL-запрос к системе базы данных. Этот запрос передается СУБД и обрабатывается. На основе полученных результатов генерируется HTML-страница, которая возвращается пользователю для посмотра на экране его компьютера с помощью браузера.

Каким же образом осуществляется доступ к содержимому упоминавшихся выше файлов, размещенных в различных узлах Интернет? Это стало возможным благодаря тому, что в Веб-браузеры встроена поддержка не только протокола HTTP обмена гипертекстовыми ресурсами с Веб-серверами, но и протоколов доступа к другим информационным сервисам Интернет. В рассматриваемом случае для доступа к файлам скрытого Веб используется протокол FTP.

Для обеспечения доступа необходимо, чтобы какая-либо гиперссылка на просматриваемой пользователем странице указывала с помощью URL на нужный файл. При попытке пользователя перейти к ресурсу, на который указывает эта гиперссылка, браузер обнаружит в URL указание на то, что доступ должен осуществляться с помощью протокола ftp и вызовет соответствующие механизмы поддержки этого протокола. Эти механизмы обеспечат связь с нужным FTP-сервером и прием на данный компьютер содежимого запрашиваемого файла. Кроме того, они проанализируют расширение имени целевого файла гиперссылки, вызовут нужную программу просмотра, если она подключена к браузеру.

НЕ нашли? Не то? Что вы ищете?

Эта программа, в свою очередь, обеспечит просмотр содержимого интересующего пользователя файла. Если, например, пользователь по гиперссылке осуществил навигацию на ресурс, содержащийся в файле с расширением pdf, то в качестве программы просмотра будет вызван Acrobat Reader. Это – известная программа, разработанная и свободно распространяемая компанией Adobe. Конечно же, она должна быть заранее установлена на пользовательском компьютере и подключена к Веб-браузеру.

Наряду с непосредственным доступом к информационным ресурсам Веб описанным выше образом, существуют многочисленные приложения Веб, которые обеспечивают доступ к ресурсам «подведомственных» им Веб-серверов с помощью своих собственных механизмов и реализуемых ими технологий. Примером приложений такого рода являются поисковые машины Веб. Имеется ряд таких свободно доступных поисковых сервисов. Одной из наиболее популярных зарубежных поисковых машин Веб является AltaVista. Для поиска в российской части Веб чаще всего используется Yandex.

Доступ к поисковой машине осуществляется путем обращения к ее домашней странице как к обычной странице Веб. Эта страница содержит обычно HTML-формы, в окна которых пользователь должен ввести свой поисковый запрос. Большинство поисковых машин способно осуществлять полнотекстовый контекстный поиск по заданным ключевым словам или словосочетаниям. Некоторые из них допускают использование булевских критериев поиска, предоставляют и другие возможности.

В качестве результатата обработки пользовательского запроса поисковая машина выдает на сторону клиента последовательность HTML-страниц, содержащих список гиперссылок на страницы Веб, релевантные критерию поиска. Пользователь может просматривать этот список, обычным для Веб образом переходить по гиперссылкам на указанные в нем страницы и анализировать их содержание.

Для обеспечения приемлемого уровня производительности поисковая машина, конечно же, не осуществляет непосредственный просмотр страниц Веб в процессе обработки пользовательского запроса. Используется иная технология. Периодически в фоновом режиме поисковая машина осуществляет просмотр и индексирование Веб-сайтов, принадлежащих ее области действия. Построенные при этом индексы страниц, хранимые данной поисковой машиной, она и использует на стадии обработки пользовательских запросов. Иначе говоря, поиск интересующих пользователя страниц осуществляется по этим индексам, поддерживаемым поисковой машиной, а не непосредственно в Веб.

Поскольку в период между моментом индексирования страницы и моментом обнаружения ее в индексе при обработке запроса данная страница могла подвергнуться изменениям или вообще была удалена со своего сайта его Веб-мастером, среди результатов поиска могут оказаться неактуальные ("висячие") ссылки – ссылки на отсутствующие в Веб в данный момент страницы или ссылки на страницы, которые теперь уже не удовлетворяют поисковому критерию. Доля таких ссылок в списке результатов поиска обычно невелика, если поисковая машина достаточно регулярно актуализирует поддерживаемые индексы.

Результаты контекстного поиска характеризуются, однако, высоким уровнем информационного шума. Многие найденные при обработке пользовательского запроса страницы Веб, хотя формально и удовлетворяют критерию поискового запроса, на самом деле нерелевантны информационным потребностям пользователя. Снизить уровень информационного шума при поиске можно только используя методы поиска, учитывающие смысловое содержание совокупности информационных ресурсов, составляющих область поиска.

Для решения этой задачи в язык HTML были включены простейшие средства описания смыслового содержания страниц Веб. С этой целью в версии языка HTML 2.0 был введен тег META. Этот тег имеет два атрибута NAME и CONTENT. Значение первого из них указывает имя свойства описываемой страницы, например, ФАМИЛИЯ (лица, о котором идет речь в тексте, представленном на данной странице) или КОМПАНИЯ (к которой имеют отношение приведенные на данной странице экономические показатели). Значение второго атрибута определяет значение того свойства, которое указано первым атрибутом. Таких тегов в страницу может быть включено сколько угодно. Каждый из них будет определять одно из свойств данной страницы. Благодаря этим сведениям поисковые машины и другие приложения Веб могут более эффективно осуществлять поиск на множестве страниц Веб, снабженных такими описаниями.

Наряду с тегом META был введен также тег LINK, который по замыслу разработчиков рассматриваемой версии языка должен ссылаться на страницу Веб, которая содержит описание смысла самих определяемых свойств в тегах META на данной HTML-странице. Такую ссылку можно одновременно использовать как уникальный идентификатор совокупности имен свойств, с некоторым приписанным им смыслом.

Заметим, что никакого единого стандартного набора свойств для языка HTML от имени W3C при этом не было предложено. Поэтому важное значение имело создание впоследствии для использования в электронных библиотеках широко признанного набора таких свойств, названного Дублинским ядром (по названию города Дублин в США, где проводился симпозиум, одобривший первую версию набора, которая включала 13 свойств). Свойства, входящие в состав Дублинского ядра, были названы элементами метаданных Дублинского ядра.

Таким образом, Дублинское ядро определяет стандартизованный набор свойств, которые могут быть использованы, в частности и для описания смыслового содержания страниц Веб. Такое описание может быть встроено в описываемые им страницы, например, с помощью рассмотренных выше тегов LINK и META.

Достигнутое соглашение о составе элементов метаданных Дублинского ядра фиксирует состав принадлежащих ему элементов. Однако на вербальном уровне трудно однозначным образом приписать каждому из них точный смысл. Например, элемент Date в различных случаях может иметь разный смысл – дата публикации страницы в Веб, дата последнего обновления этой страницы и т. д.

По этой причине в 2000 г. для Дублинского ядра была предложена концепция квалификаторов, опубликован их первоначальный состав.

Квалификаторы – это уточнители семантики элементов метаданных Дублинского ядра и их значений в различных конкретных случаях их применения. Например, для элемента Date можно указать, что имеется в виду время создания ресурса, время его доступности или время, в течение которого его содержание имеет силу и т. д. Для значения элемента Relation можно указать, что оно представлено в формате URL.

Если квалификатор, указанный для некоторого элемента метаданных Дублинского ядра оказался неизвестным для приложения Веб, то он должен игнорироваться.

Работа над соданием новой версии набора квалификаторов для элементов метаданных Дублинского ядра, продолжается.

Контрольные вопросы

Какая единица информационных ресурсов используется в операциях доступа пользователей к Веб?

Сколько обращений к Веб-серверу должен выполнить пользователь для получения одной HTML-страницы на клиентский компьютер?

Какие операции доступа к информационным ресурсам Веб обеспечивают Веб-браузеры?

Какими средствами определяются в Веб навигационные пути доступа к его информационным ресурсам?

Как осуществляется доступ к содержимому файлов “скрытого Веб”?

Каким образом обеспечивается глобальный доступ к базам данных с помощью Веб?

Какие возможности доступа к информационным ресурсам Веб предоставляют пользователям поисковые машины?

Благодаря чему обеспечивается высокая производительность поисковых машин Веб при обработке запросов?

Каковы негативные следствия технологии, используемой в поисковых машинах Веб для обработки запросов?

Какие средства были включены в язык HTML для обеспечения возможности снижения уровня информационного шума в результатах обработки пользовательских запросов?

Для каких целей создано Дублинское ядро, из каких элементов оно состоит?

Что представляют собой квалификаторы Дублинского ядра?

10.7. Веб, JavaScript и Java

Одна из слабых сторон ранних версий языка HTML заключалась в статическом характере представляемых с его помощью информационных ресурсов. HTML-страницы не могли содержать «исполняемого содержимого». Возможность включения в них таких динамических компонентов позволила бы значительно обогатить не только информационные ресурсы Веб, но и функции Веб-браузеров.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99