Міністерство освіти і науки України

Сумський державний університет

Web-програмування та web-дизайн

Технологія XML

Рекомендовано вченою радою

Сумського державного університету

як навчальний посібник

Суми

Видавництво СумДУ

2009

Б.

Web-програмування 

та web-дизайн

Технологія XML


Проценко Олена Борисівна

Web-програмування та web-дизайн

Технологія XML

Дизайн обкладинки

Редактор

Комп’ютерне верстання

Підп. до друку 6.04.2009.

Формат 60´84/16. Папір офс. Гарнітура Times New Roman Cyr. Друк офс.

Ум. друк. арк.7,44. Обл.-вид. арк.5,58.

Тираж 50 пр. Вид. №

Зам. № .

Видавництво СумДУ при Сумському державному університеті

4007, Суми, в

Свідоцтво про внесення суб’єкта видавничої справи до Державного реєстру ДК № 000 від 17.12.2007 р.

Надруковано у друкарні СумДУ

4007, Суми, в.

УДК 004

П 84

Рекомендовано до друку вченою радою Сумського державного університету (протокол № від р.)

Рецензенти:

д-р техн. наук, проф. ,

канд ф.-м. наук, доц.

(Сумський державний університет);

П84

Web-програмування та web-дизайн. Технологія XML: Навчальний посібник. – Суми: Видавництво СумДУ, 2009. – 127 с.

Посібник містить теоретичні та практичні відомості про синтаксис, основні конструкції та застосування мови XML.

Посібник може бути корисним як для студентів, аспірантів і викладачів, так і для широкого кола фахівців, що займаються проблемами програмування для Інтернету.

УДК 004

Ó , 2009

Ó Вид-во СумДУ, 2009

Міністерство освіти і науки України

Сумський державний університет

НЕ нашли? Не то? Что вы ищете?

До друку та в світ дозволяю

на підставі „Єдиних правил”,

п.2.6.14.

Заступник першого проректора

начальник організаційно-

методичного управління єв

Web-програмування та web-дизайн

Технологія XML

Усі цитати, цифровий,

фактичний матеріал,

бібліографічні дані

перевірені, запис

одиниць відповідає

стандартам

Укладач

Відповідальний за випуск

Декан факультету ЕлІТ С. І. Проценко

[

Суми

Видавництво СумДУ

2009

ЗМІСТ

С.

Вступ. 5

Розділ 1 Створення xml-даних ………………………………... 6

Розміщення атрибутів у екземплярі xml 8

Порожні елементи 9

Сім’я xml-технологій 11

Створення і перегляд xml документа 12

Синтаксис мови xml 14

Правильне вкладення елементів 17

Визначення імен у xml 18

Декларації xml 18

Правильні екзмпляри xml 19

Визначення типу документа 23

Простий елемент із текстовим вмістом 25

Розділ 2 Внутрішні схеми DTD………………………...……. 26

Елемент, що містить дочірній елемент 27

Оголошення порожнього елемента 28

Використання ключового слова any 29

Змішаний вміст елементів 30

Використання атрибутів 31

Оголошення атрибутів першого типу 32

Визначення атрибутів маркованого типу 33

Використання атрибутів типів ID і IDREF 34

Використання елементів ENTITY в схемах DTD 41

Використання в схемах DTD атрибутів переліченого типу 43

Аналіз правильних екземплярів 46

Розділ 3 Схеми XDR 47

Розроблення XDR –схем 48

Оголошення типу елемента 49

Оголошення ElementType вкладених елементів 51

Елемент АttributeТype 54

Типи даних у XDR-схемах 57

Індикатори входження в XDR-схемах 59

Додаткові обмеження типів даних у XDR-схемах 62

Використання груп вмісту 62

Розділ 4 Мова визначення схем xml ( XSD) 66

Простори імен. 68

Прості елементи 70

Прості типи даних, що використовуються в схемах XSD.. 72

Елементи складних типів 73

Обмеження входжень у схемах XSD 75

Опис атрибутів. 77

Перевірка документів. Три підходи: XDR, DTD, XSD 81

Основи використання xsl-таблиць стилів 82

Розділ 5 Обробка хml-даних………………………………….. 98

Використання декількох шаблонів 98

Фільтрація і сортування даних xml 101

Доступ до атрибутів xml 107

Використання каскадних таблиць стилів 109

Список літератури……………………………………………. 126


ВСТУП

XML (Extensible Markup Language) - це мова розмітки, що описує цілий клас об'єктів даних, які називаються XML-документами. Ця мова використовується як засіб для опису граматики інших мов і контролю за правильністю складання документів. Тобто сам по собі XML не містить ніяких тегів, призначених для розмітки, він просто визначає порядок їх створення. Таким чином, якщо, наприклад, ми вважаємо, що для позначення елемента porche в документі необхідно використовувати тег <car>, то XML дозволяє вільно використовувати визначений користувачем тег і включати його в XML - документ.

Виділяють сім основних характеристик мови XML:

1. XML пропонує метод структуризації файлу у вигляді текстового файлу.

2. XML схожий на HTML.

3. XML зрозумілий як комп'ютеру так і людині.

4. XML утворює ціле сімейство технологій.

5. XML достатньо гнучкий.

6. XML достатньо новий, але у нього глибоке коріння.

7. XML вільний від ліцензійних відрахувань, платформенно-незалежний, має широку підтримку.

Розглянемо деякі характеристики детальніше.

XML пропонує метод структуризації файлу у вигляді текстового файлу

Дуже часто трапляються казуси, коли необхідно дані однієї програми перемістити в іншу, але формат даних у цих програмах не збігається, а отже, і дані перемістити не-можливо.

XML забезпечує таку можливість, оскільки будь-яке його застосування може працювати зіз текстовими документами, і будь-яка людина може прочитати і зрозуміти текст.

XML дозволяє зберігати в текстовому форматі структуровані дані. XML - це набір правил для створення текстових форматів, простих для обробки комп'ютерами різних типів. Отримані текстові файли структуровані таким чином, що вони:

точно виражені;

розширені;

платформенно-незалежні.

Для розроблення XML-файлів можна використовувати будь-який текстовий редактор. XML–документи, як правило, мають розширення *.xml, але спеціалізовані діалекти, створені в рамках XML, можуть мати розширення:

*.xls – файли розширеної таблиці стилів (Ехtensible Stylesheet Language);

*.xsd – визначення розширеної схеми (Еxtensible Schema Definition);

*.xdr – скорочена схема даних XML (XML Data Reduced Schema);

*.mml –математична мова розмітки (MATHML Mathematical Markup Language);

*.cdf – формат визначення каналів (Channel Definition Format).

Розділ 1 СТВОРЕННЯ XML-ДАНИХ

У мов XML і HTML є декілька схожих характеристик.

Якщо розглянемо приклад розмітки наступного тексту, відповідь на питання це XML або HTML стане складною.

<p>Так, зазвичай, оформлюють

<em> виділений текст </em> у HTML</p>

Відповідь буде правильною у будь-якому випадку, оскільки це приклад оформлення документів і в XML і в HTML.

Проте мова XML була розробленою для того, щоб подолати обмеження, що накладаються мовою HTML. Так, розробник XML-документа може сам визначити ряд своїх власних дескрипторів. Наприклад, якщо дескриптор параграфа в HTML – <p> – єдиний, який може задавати і описувати параграф, то розробник документа XML може самостійно ввести дескриптор параграфа одним з нижче перелічених дескрипторів:

<indent>

<paragraph>

<para>.

Найпростіший елемент включає дескриптор, що відкривається, вміст, дескриптор, що закривається. Наприклад,

<title> Вивчаємо XML </title>.

ПРАВИЛО. Весь рядок <title>Вивчаємо XML</title> називається елементом, дані між дескрипторами називаються вмістом елемента.

ПРАВИЛО. Всі елементи мають бути обов'язково завершені. Всі не порожні елементи обов'язково повинні містити дескриптор, що відкривається і дескриптор, що закривається. Порожні елементи мають бути закриті за наступним правилом.

ПРАВИЛО. Порожній елемент завжди записується за стандартним правилом синтаксису порожнього елемента:

<ім'я _елемента/>.

РОЗМІЩЕННЯ АТРИБУТІВ У ЕКЗЕМПЛЯРІ XML

Слід відзначити, що, як і в HTML, у мові XML є атрибути, які змінюють або класифікують елементи і вказуються у дескрипторі, що відкривається.

Синтаксис визначення атрибута для елемента такий:

<ім’я_елемента ім’я_атрибута=“значення”> Зміст елемента відповідного елемента </ім’я_атрибута>.

Атрибути розміщуються завжди у дескрипторі, що відкривається. Дескриптор, що відкривається, у елементі може містити декілька атрибутів, дотримуючись таких правил:

<ім’я_елемента

ім’я_атрибута= “значення”

ім’я_атрибута= “значення”

ім’я_атрибута= “значення”> Зміст елемента відповідного елемента </ім’я_атрибута>.

Наприклад,

<account type= “checking” currency= “Gryvnja”>

<name>Івченко</name>

<balance>18623,12</balance>

</account>.

Усі значення атрибутів мають бути обов'язково в лапках. У разі відсутності хоча б однієї з лапок, парсер видає таке зауваження (рисунок 1):

The XML page cannot be displayed

Cannot view XML input using style sheet. Please correct the error and then click the Refresh button, or try again later.

A string literal was expected, but no opening quote character was found. Error processing resource

file:///D:/WORK/Web-pro...

<?xml version= 1.0"?>

----^

Рисунок 1 -­ Результат відображення неправильно оформленого атрибута

Визначення того, чи є дана властивість елементом або атрибутом, є досить непростим питанням.

ПОРОЖНІ ЕЛЕМЕНТИ

Елементи XML можуть містити текст, інші елементи, будь-яку комбінацію тексту та інших елементів або ж бути просто порожніми елементами.

Порожній елемент завжди записується за стандартним правилом синтаксису елемента:

<ім'я _елемента/>.

Наприклад,

<date month=“September” day=“19” year=“2009” />.

Даний елемент є порожнім, навіть, не дивлячись на те, що містить атрибути. Враховуючи той факт, що повна інструкція

<date month=“September” day=“19” year=“2009”>

</date>

функціонує також як і коротка, для написання порожнього елемента прийнято використовувати коротку форму.

Розглянемо фрагмент HTML-тексту

<html>

<h1> letter </h1>

<p>From: O. Protsenko </p>

<p>to: All students </p>

<p>Subject: Questions to exam </p>

<p>Date: 19</p>

<message> </message>

</html>

аналогічний фрагмент XML-тексту виглядає так:

<letter>

<from> O. Protsenko</from>

<to> All students </to>

<subject> Questions to exam</subject>

<date month=”September” day=“19” year=”2009” />

<message> Questions </message>

</letter>.

Якщо поставити собі питання, який із фрагментів містить більше даних для обробки програмним додатком, то відповідь зрозуміла – XML.

Інша відмінність полягає в тому, що HTML змішує зміст і форматування в одному потоці розмітки. Так, наприклад, елементи <h1> і <b> свідчать, яким чином мають бути виділені елементи, і де розміщені об'єкти, виділені такими елементами.

Мова XML припускає, що зміст і зовнішній вигляд повинні зберігатися окремо від даних розмітки. XML повністю покладається на каскадні таблиці стилів (CSS або XSL) при відображенні або перетворенні документів з однієї структури в іншу.

СІМ’Я XML-ТЕХНОЛОГІЙ

Оскільки XML-документ містить елементи, які описують самі себе, він зрозумілий людині на інтуїтивному рівні. Семантика даних забезпечує «інтелектуальність», яка подана в XML-елементах і значеннях атрибутів.

Не дивлячись ні на що, XML – це програмний код, який читається і використовується обробниками XML.

XML утворює цілу сім’ю технологій. У сім’ю XML входить ряд важливих технологій:

XML Version 1.0

Технічні рекомендації про використання XML.

DTD

Визначення типу документа.

XDR

Формат XML Reduced ( схема Microsoft).

XSD

Визначення схеми XML (схема консорціуму W3C).

Простори імен

Метод визначення імен елементів та атрибутів.

XPath

Мова шляхів XML.

XLink

Мова посилань XML.

XPointer

Мова покажчиків XML.

DOM

Програмний інтерфейс API для об'єктної моделі документів.

SAX

Simple API for XML (Простий програмний інтерфейс API для XML).

XSL

Розширена мова таблиць стилів.

XSL-FO

Об'єкти форматування XSL.

XSLT

Мова перетворень XSL.

X Include

Синтаксис XML Include.

XBase

Синтаксис XML Base URI.

Деякі з перелічених компонент до цих пір знаходяться в процесі розроблення, хоча використовуються досить широко, і можуть зазнавати значних змін. Тому особливу увагу необхідно приділяти тому, як та чи інша технологія описана в W3C.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9