С созданием Веб, когда язык HTML стал использоваться в Интернет как базовая технология представления информационных ресурсов для этой среды, началось массовое применение гипертекстовых технологий. В этих условиях концепция гипертекста получила дальнейшее развитие, стала основой технологий гипермедиа. Гипермедийной называют такую гипертекстовую среду, в которой гипертекстовые элементы содержат встроенные информационные ресурсы, представленные в отличных от текста средах – аудиоданные, видеоданные и т. п.

Содержательно законченной единицей информационных ресурсов Веб является HTML-страница, которая формируется следующим образом. Основой содержания будущей HTML-страницы является некоторый текстовый файл. Для создания его гипертекстового представления производится разметка содержимого этого файла средствами языка гипертекстовой разметки HTML (см. подробнее 7.5). В полученный файл с размеченным содержимым, называемый далее HTML-файлом, включаются также некоторые дополнительные конструкции языка HTML:

для представления границ размеченного кода HTML в соответствии с синтаксисом языка

для представления комментариев, фонового цвета или фонового рисунка, используемых при показе страницы на экране

для вставки изображений и различных мультимедийных элементов в страницу

для включения в нее скриптов на языке JavaScript и вызовов Java-аплетов

для включения различных оформительских элементов, указания даты последнего обновления страницы и т. д.

Данные, содержащиеся в HTML - файле, становятся самоописываемыми, поскольку описание их свойств, представленное разметкой, содержится в самих этих данных, а не представляется в форме автономного документа, отделенного от описываемых данных, как это делается, например, в системах баз данных.

НЕ нашли? Не то? Что вы ищете?

Полная HTML-страница представляется совокупностью файлов, которая помимо носителя ее структуры – HTML-файла включает также файлы встроенной графики и других мультимедийных элементов HTML-страницы. Таким образом, язык HTML выступает в роли интегратора текстовых и мультимедийных информационных ресурсов. Поэтому при необходимости информационные ресурсы Веб могут быть не только гипертекстовыми, но и гипермедийными.

Важными элементами организации и представления информационных ресурсов Веб являются гиперссылки, которые, как указывалось выше, могут встраиваться в размечаемый текст. Гиперссылки позволяют не только организовать в виде гипертекста содержание отдельной HTML-страницы, но и определять глобальные гиперструктуры, компонентами которых являются HTML-страницы и/или фрагменты страниц, поддерживаемые на разных Веб-серверах. Пользователь, стартуя с некоторой точки этой структуры, может далее осуществлять навигацию по гиперссылкам, не заботясь о том, с ресурсами каких Веб-серверов он имеет дело.

Важные достоинства Веб – его открытость для пользователей, в частности и для пользователей, помещающих свои страницы на Веб-серверы, отсутствие централизованного управления и тем самым необходимости каких-либо управленческих санкций на получение прав публикации ресурсов в Веб или на доступ к ним. Однако эти достоинства оборачиваются серъезной проблемой. В гиперструктуре, образованной из страниц разных Веб-сайтов, могут со временем появляться «висячие ссылки» – ссылки на отсутствующие страницы. Эта ситуация возникает в связи с тем, что Веб-мастер какого-либо сервера может удалить некоторую HTML-страницу, не располагая информацией о том, что на нее имеется гиперссылка в других страницах, представленных на иных Веб-серверах.

Итак, информационные ресурсы Веб являются гипермедийными. Они хранятся в совокупности файлов различной природы. При этом носителями гиперструктуры Веб, структурообразующими элементами его информационных ресурсов являются HTML-файлы.

В соответствии с принципами архитектуры клиент-сервер информационные ресурсы Веб поддерживаются на Веб-серверах и предоставляются пользователям с помощью программного обеспечения Веб-клиентов по их запросам. Коллекция объединенных по тематическому единству взаимосвязанных HTML-страниц, поддерживаемая каким-либо Веб-сервером, называется Веб-сайтом. Один Веб-сервер может поддерживать несколько Веб-сайтов.

По традиции структура Веб-сайта проектируется таким образом, чтобы существовала некоторая страница, из которой путем навигации по гиперссылкам были бы доступны все другие страницы этого сайта. Такая страница, являющаяся по существу точкой входа в сайт, называется его домашней страницей. Адрес этой страницы в Веб является обычно идентификатором сайта и служит для доступа к ресурсам сайта.

В страницах каждого сайта могут использоваться не только гиперссылки на другие страницы или фрагменты страниц этого же сайта (внутренние гиперссылки), но и ссылки на информационные ресурсы других сайтов (внешние ссылки).

Поэтому Веб можно рассматривать как глобальную распределенную гипермедийную открытую информационную систему, предоставляющую доступ пользователям к поддерживаемым в ней информационным ресурсам с помощью коммуникационных возможностей Интернет.

Важно отметить, что совокупности взаимосвязанных HTML-страниц могут использоваться на только в телекоммуникационном режиме, когда они представлены на каком-либо Веб-сайте, но и в локальном режиме на отдельном компьютере с помощью. В последнем случае для доступа к таким локальным информационным ресурсам можно также использовать Веб-браузер. Таким образом можно, например, использовать музейные коллекции, труды конференций или другие гипертекстовые и гипермедийные коллекции информационных ресурсов, распространяемые на компакт-дисках.

Следует сделать в заключение еще одно важное замечание. За время существования Веб сформировался огромный объем информационных ресурсов, не являющихся гипермедийными, но к которым Веб обеспечивает глобальный доступ. К их числу относится, в частности, содержимое многочисленных файлов в форматах PDF, PostScript, текстовых и графических файлов, файлов в различных других форматах, а также базы данных, поддерживаемые, как правило, с помощью SQL-серверов. Эту совокупность информационных ресурсов принято называть «скрытым» Веб. По имеющимся оценкам их объем составляет около 70% всех ресурсов, доступных в среде Веб.

Более подробно возможности доступа пользователей к информационным ресурсам Веб рассматриваются в п. 7.6.

Контрольные вопросы

Что такое гипертекст, в чем заключается его отличие от традиционного линейного текста?

Какова роль гиперссылок в гипертексте?

Какие проблемы представления информационных ресурсов порождает открытый характер Веб?

С помощью какого языка осуществляется гипертекстовая разметка документов, публикуемых в Веб?

Какие данные называются самоописываемыми?

Что такое гипермедиа?

Как называется базовая единица информационных ресурсов Веб?

Каким образом хранится HTML-страница на Веб-сервере?

Каковы функции Веб-сервера и Веб-клиента?

Что такое Веб-сайт?

Какая HTML-страница сайта называется домашней страницей?

Как называются клиентские программы Веб, предназначенные для просмотра гипертекста?

Что такое “скрытый Веб”?

Какие информационные ресурсы включает “скрытый Веб”?

10.5. Базовые стандарты технологий Веб

Как уже отмечалось, Веб замышлялся его создателями как информационный репозиторий с архитектурой клиент-сервер для широкого сообщества пользователей, легко доступный в неоднородной коммуникационной среде Интернет на различных аппаратно-программных платформах. Такая система должна по необходимости базироваться на стандартизации:

представления поддерживаемых в ней информационных ресурсов

уникальной идентификации этих ресурсов

процедуры обмена информационными ресурсами между клиентом и сервером.

Такие стандарты были разработаны для Веб. Это – язык гипертекстовой разметки HTML (Hypertext Markup Language), универсальный локатор ресурсов URL (Universal Resource Locator) и протокол передачи гипертекста HTTP (Hypertext Transfer Protocol). Кроме того, для того, чтобы обеспечить возможности расширения функций Веб-сервера, был разработан стандарт универсального шлюзового интерфейса CGI (Common Gateway Interface). Рассмотрим кратко эти базовые стандарты технологий Веб.

Язык HTML. Язык HTML относится к категории языков, называемых языками разметки. Такие языки позволяют расставлять в заданном тексте на каком либо языке пометы, выделяя структурные единицы этого текста и определяя для них различные свойства. Такая процедура называется разметкой текста.

Одним из ранних языков разметки является созданный в 70-е годы американским математиком Д. Кнутом математический язык разметки Teч, который очень широко используется во всем мире для подготовки верстки публикаций в области математики, физики, информатики. Другим популярным языком разметки является стандартный обобщенный язык разметки SGML (Standard Generalized Markup Language). Спецификации этого языка имеют статус международного стандарта (ISO 8879:1986) и широко используются за рубежом в различных издательских системах и системах управления документами.

Язык HTML был разработан основателем Веб – сотрудником CERN Т. Бернерсом-Ли именно на основе SGML. Он включает набор специальных помет, называемых тегами. Теги языка HTML позволяют размечать исходный текст, определяя способ его представления на экране компьютера, и выполнять некоторые другие функции. Теги, как правило, являются парными – имеется открывающий и закрывающий теги. Открывающий тег может иметь обязательные и/или факультативные параметры (атрибуты).

С помощью пары тегов в размечаемом тексте выделяется некоторый его фрагмент, свойства которого описывает данный тег в соответствии с его функцией и с помощью значений параметров, если они предусматриваются для данного тега в синтаксисе языка. Выделяемые парами тегов фрагменты размечаемого текста могут быть вложенными. Другого рода пересечения фрагментов не допускаются. Таким образом, размеченный тегами HTML текст представляет собой последовательность иерархий выделенных тегами фрагментов.

Теги языка HTML позволяют с помощью разметки исходного текста:

идентифицировать содержимое текстового файла как текстовый ресурс, размеченный средствами языка HTML, называемый HTML-страницей

снабжать HTML-страницы текстовым заголовком

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99