(Барнаул, БГПУ)

ТЕХНОЛОГИИ РАЗМЕЩЕНИЯ МАТЕМАТИЧЕСКОЙ

ИНФОРМАЦИИ НА ОБРАЗОВАТЕЛЬНОМ СЕРВЕРЕ.

В век информатизации мы видим, что информация становится стратегическим ресурсом общества. Возникает потребность в разработке новых информационных технологий как для получения и переработки больших объемов информации, так и для ее хранения и предоставления пользователям. В числе таких бурно развиваемых в настоящий момент технологий являются Internet технологии.

Роль этих технологий в сфере науки и образования России особенно велика в связи с существующим информационным голодом, причинами которого стали катастрофическое падение объема подписки научно-технических библиотек, существенное сокращение числа получаемых библиотеками иностранных и отечественных изданий, а также падение тиражей и числа выходящих в настоящее время русскоязычных книг и журналов. Известно, что не только развитие, но и поддержка научных исследований на должном уровне не мыслима без обмена информацией. Единственным выходом из создавшегося положения является использование сетевых информационных ресурсов мирового научного сообщества, представляемых Internet.

Использование гипертекстовых форматов очень удобно для формирования электронных публикаций, а процесс создания электронных версий текущих периодических изданий, книг, препринтов и чисто электронных изданий протекает настолько интенсивно, что через очень короткий промежуток времени популярность электронных публикаций в научном сообществе может стать очень значительной.

НЕ нашли? Не то? Что вы ищете?

В мире уже сейчас существуют целые электронные библиотеки, доступные через Internet, в качестве примеров можно назвать электронные библиотеки Американского (http://www. ams. org) Европейского (http://www. emis. de) математических обществ или электронные библиотеки Мичиганского (http://www. lib. msu. edu) и Стенфорского (http://vlib. stanford. edu/Overview. html) университетов.

Однако, не смотря на большое количество проектов создания полнотекстовых баз данных, доступных в среде Internet, говорить о том, что в мире существует какая-либо общепризнанная технология создания электронных баз данных, нельзя. Каждый из реализуемых проектов использует, как правило, свою технологию размещения информации в гиперпространстве, основываясь лишь на унификации средств доступа к данным на основе Intranet технологии.

При размещении математической информации на образовательном сервере, существует очень важная проблема, связанная с представлением математических формул в гипертекстовых документах.

Не смотря на большое количество публикаций (см., например, форум на сервере W3C (http://www. w3.org), посвященный проблеме представления математических текстов (http://www. w3.org/Math/)) эта проблема до сих пор не имеет удовлетворительного решения. Из наиболее часто применяемых методов представления математических формул в гипертекстовых документах используются следующие:

-  вставка математических формул в виде графических файлов (в этом случае удобно использовать конвертер LaTex2HTML);

-  вставка математических символов из специального шрифта (например, SYMBOL), имеющегося на машине клиента (конвертеры TTH и TTMath);

-  загрузка математических шрифтов на машину клиента и использование Java аплетов для их отображения (например, WebEq);

-  использование plug'in для Internet-браузеров (techexplorer).

Все эти способы входят в проект W3C Math, развиваемый World Wide Web Consortium (W3C). Помимо этих способов World Wide Web Consortium разработал стандарт (Mathematical Markup Language - MathML) представления гипертекстовых документов с математическими формулами. Однако стандарт MathML в настоящий момент еще не поддерживается ведущими производителями Internet-браузеров, но в то же время его можно уже сейчас опробовать с помощью браузера Amaya.

Рассмотрим более конкретно указанные выше способы представления математической информации на образовательном сервере.

Первый - является наиболее универсальным и будет уверенно работать под любым WWW браузером. Суть данного способа заключается в следующем: текстовая информация исходного LaTeX документа преобразуется в HTML-документ как есть с сохранением структуры документа, а формулы и рисунки преобразуются во внешние графические файлы с помощью специальных утилит. Недостатками данного метода являются генерация внешних графических файлов, которые в случае большого количества формул могут привести к увеличению объема гипертекстового документа, отсутствие возможностей организации контекстового поиска по формуле, а также нарушения соответствия размеров текста и формул в случае индивидуальных настроек браузера на машине клиента.

Второй способ является наиболее быстрым в связи с тем, что формулы не генерируются в отдельные графические файлы, а собираются на машине клиента из имеющихся на ней шрифтов. В связи с этим, качество вывода оставляет желать лучшего. Кроме того, во-первых, используемые шрифты не являются стандартом и поэтому на некоторых платформах могут требовать дополнительных настроек, а, во-вторых, результирующее представление формул не оставляет возможностей организации контекстового поиска по формуле.

Третий способ является наиболее гибким и позволяет достигать высокого качества изображения независимо от используемой платформы. WebEq является Java Applet'ом, который позволяет достаточно просто включать авторам математические выражения в WEB'ские страницы. Математические выражения непосредственно вставляются в HTML'ские файлы, с использованием обычного редактора, что выгодно отличает этот пакет от пакета latex2html, для использования которого необходимо использование специальных приложений.

В текущей версии WebEQ 2.3 имеется два способа представления математической нотации: первый основан на спецификации MathML, второй на языке LaTeX.

Математические нотации непосредственно вставляются в HTML-файл, легко редактируются, и непосредственно не используют графических файлов. Вставка графических файлов с математическими символами осуществляется Java приложением.

Четвертый способ интересен тем, что исходный текст в формате LaTeX передается на машину клиента в том виде, как он есть. То есть по объему передаваемой информации это наиболее предпочтительный метод. На клиентские браузеры (должны быть использованы их четвертые версии или выше) устанавливается plug'in texexplorer, который и преобразует передаваемый текст к требуемому виду. Пакет имеет ряд стилевых возможностей, которые позволяют сформировать исходный текст в гипертекстовой форме (нечто наподобие HTML).

Рассмотрев вышеперечисленные способы, можно сделать вывод, что пока наиболее оптимальным решением остается использование первого способа как наиболее быстрого и универсального. Но хочется надеяться, что в ближайшем будущем все же будет принят стандарт (вероятнее всего это будет MathML), которого будут придерживаться ведущие производители Internet-браузеров.