Однако между информационными системами ЭИ и системами ЭБ существуют и важные различия. Если ЭИ представляет собой законченный продукт, не предполагающий развития, то ЭБ является системой, открытой для пополнения или удаления информационных объектов, реорганизации структуры информационного пространства, изменения системы внутренних связей.

Второе отличие связано с тем, что ЭБ должны иметь возможность активно использовать информацию, доступную через телекоммуникационные системы.

Очевидная важность и перспективность деятельности по созданию и использованию ЭБ и необходимость координации деятельности различных государственных и негосударственных организаций по созданию ЭБ диктует необходимость разработки специальной общегосударственной программы по созданию ЭБ, Такая программа под названием Федеральная целевая межведомственная программа (ФЦМП) “Электронные библиотеки” разрабатывается в настоящее время по заданию Правительства РФ рабочей группой под эгидой Миннауки России. Авторы являются членами этой рабочей группы.

Изложенное выше представление об ЭБ было положено в основу предложений НТЦ “Информрегистр” по разработке ФЦМП “Электронные библиотеки”. Далее кратко излагаются наши предложения по целям, задачам и содержанию работ по этой программе.

Целями ФЦМП “Электронные библиотеки” являются:

    обеспечение доступа российских и иностранных граждан к информационным ресурсам России в сфере науки, культуры, образования и здравоохранения; повышение качества образования всех уровней при помощи использования современных информационных технологий; распространение сведений о научно-технических достижениях российских исследователей, научно-техническом потенциале российсих предприятий с целью привлечения инвестиций; расширение сферы применения русского языка в Интернет, удовлетворение информационных потребностей русскоязычной диаспоры в СНГ и дальнем зарубежье; увеличение доли России в мировом информационном рынке; сохранение особо ценных архивных и музейных коллекций при помощи создания их электронных копий.

Задачами ФЦМП являются:

НЕ нашли? Не то? Что вы ищете?
    создание и предоставление для массового использования фондов (коллекций) ЭБ на основе информационных ресурсов, имеющих особую социальную значимость; создание системы координации межведомственных, отраслевых и региональных проектов создания ЭБ в России; определение общесистемных правовых и организационных принципов создания и функционирования ЭБ для решения социальных, научно-технических, образвательных и культурных задач на всей территории России; разработка архитектуры, логико-лингвистического обеспечения и программно-технологических средств для функционирования ЭБ; создание первоочередных ЭБ для апробации разработанных принципов и средств;

Содержание работ по Программе В области правового обеспечения функционирования ЭБ - разработка предложений по совершенствованию действующих или принятию новых нормативных актов в части

    статуса ЭБ как составной и особо ценной части государственных информационных ресурсов; обеспечения права доступа к ЭБ для граждан и организаций; обеспечения информационной безопасности ЭБ: защите авторского права и других форм интеллектуальной собственности при функционировании ЭБ; правам, обязанностям и ответственности участников ЭБ (включая вопросы лицензирования отдельных видов деятельности); порядка комплектования фондов ЭБ из государственных и негосударственных информационных ресурсов.

В области организации управления и финансирования ФЦМБ “Электронные библиотеки”:

    создание органов управления ФЦМБ “Электронные библиотеки” и обеспечение их функционирования; разработка и реализация порядка экспертизы заявленных проектов и контроля их выполнения; координация ФЦМБ с федеральными, ведомственными и региональными программами в сфере информатизации, организация международного сотрудничества в рамках ФЦМБ; организация контроля за целевым использованием выделенных бюджетных средств; организация деятельности по привлечению внебюджетных средств для реализации ФЦМБ;

В области создания фондов (коллекций) ЭБ

    определение требований к видовому и тематическому составу фондов ЭБ на основе критериев их социальной значимости, а также степени готовности электронных ресурсов; формирование представительной коллекции электронных фондов ЭБ на базе имеющихся электронных информационных ресурсов участников ФЦМБ; организация оцифровки особо ценных документов из фондов участников ФЦМБ; организация комплектования фондов ЭБ на основе электронных форм печатных изданий.

В области выбора и разработок средств логико-лингвистического обеспечения ЭБ:

    определение состава и разработка типовых вариантов и форматов представления основных типов данных в ЭБ (реляционных БД, полнотекстовых, графических и мультимедийных документов и данных), а также кодировок; разработка архитектуры системы метаданных ЭБ, принципов и технологии ее применения; создание словарей, классификаторов и других средств лингвистического обеспечения; выбор и создание средств автоматической обработки данных на естественном языке, а также графических и мультимедийных данных.

В области программно-технологического обеспечения ЭБ

    разработка и стандартизация программно-технологических средств подготовки и загрузки в ЭБ документов и данных основных типов; разработка технологии хранения больших и сверхбольших массивов в ЭБ, их архивации и обеспечению доступа к ним; выбор или разработка типовых программмно- технологических средств ЭБ для основных категорий участников ФЦМБ; выбор или разработка программно-технологических средств защиты информации в ЭБ; разработка или определение требований к системе навигации и пользовательским интерфейсам в ЭБ; выбор или разработка протоколов и стандартов для обеспечения совместимости программно-технологического обеспечения ЭБ выбор или разработка программно-технологических средств управления в ЭБ, включая контроль выполнения услуг и средства взаиморасчетов.

Авторы надеются, что изложенная концепция ЭБ и предложения по составу работ по созданию ЭБ найдут отражение в концептуальных и организационных документах ФЦМП “Электронные библиотеки”.

История отдела электронных библиотек


Начало...
Основные принципы подготовки и представления информации в электронной форме
Электронные издания на компактных оптических дисках
Фундаментальная электронная библиотека «Русская литература и фольклор»
Другие проекты электронных библиотек
Подготовка информации для сервиса «Яндекс–словари»
Исследования в области электронных библиотек и электронных изданий
Основные итоги и перспективы

Начало деятельности НТЦ «Информрегистр» в области электронных изданий и электронных библиотек относится к середине 1994 г. Эти работы были возложены на отдел стандартизации и сертификации баз и банков данных, преобразованный в 1996 г. в отдел электронных изданий. При этом был определен перечень основных задач, решение которых было поставлено перед отделом. В последующем на основе полученных результатов и накопленного опыта этот перечень уточнялся и расширялся. В общей сложности исследования и разработки велись по следующим основным направлениям:

· анализ отечественного и зарубежного опыта по созданию электронных изданий и электронных библиотек, мониторинг русскоязычных электронных библиотек;

· разработка основных принципов подготовки и представления информации в электронной форме в полнотекстовых информационных системах;

· создание технологии преобразования печатной информации в электронную форму;

· работы по терминологии в области электронных изданий и электронных библиотек;

· создание электронных изданий на компактных оптических дисках;

· создание электронных библиотек.

К настоящему времени по указанным направлениям были получены следующие результаты:

· создана концепция подготовки и представления информации в электронной форме в полнотекстовых информационных системах, положенная в основу создаваемых систем;

· подготовлены один государственный и три отраслевых стандарта;

· разработан программно-технологический комплекс подготовки информации, эксплуатирующийся в настоящее время в промышленном режиме и позволяющий обрабатывать ежегодно десятки тысяч печатных страниц;

· выпущено на компактных оптических дисках пять электронных научных изданий;

· создана электронная библиотека «Нормативная база ГСНТИ»;

· ведется мониторинг русскоязычных электронных библиотек;

· проведено исследование проблемы долговременного сохранения электронной информации и подготовлены предложения по организации работ в этом направлении.

Особо следует выделить создание Фундаментальной электронной библиотеки «Русская литература и фольклор» (ФЭБ) — первой крупномасштабной сетевой электронной библиотеки академического типа. Эта библиотека оказалась широко востребованной как в России, так и за рубежом. Она способствует сохранению и распространение произведений русской литературы и материалов научных исследований. Кроме того, этот проект имеет большое значение и для других направлений исследований и разработок. Во-первых, в нем аккумулируются и проверяются результаты других работ, а во-вторых, этот проект сам является источником новых решений и базой для новых проектов. Работы по ФЭБ ведутся совместно с Институтом мировой литературы им. РАН, специалисты которого осуществляют важный вклад в реализацию проекта. Содействует библиотеке Межведомственный суперкомпьютерный центр — на его технических средствах она размещена и функционирует. Поддержка со стороны академии наук имеет принципиальное значение для проекта.

При разработках программного обеспечения существенная помощь была оказана специалистами компании «Яндекс». Установившееся сотрудничество позволило привлечь отдел к работам по развитию сервиса «Яндекс–словари».

Основные принципы подготовки и представления информации в электронной форме

Выработка принципов подготовки и представления информации в электронной форме в полнотекстовых информационных систем началась в 1994 г. Это работа основывалась на предыдущем опыте наших специалистов, анализе развития информационных технологий и потребностей конечных пользователей (читателей). Первый законченный вариант основные принципы подготовки информации приобрели в 1997 г. в виде концепции электронных научных изданий. Учитывая большое значение и интенсивное развитие электронных изданий и электронных библиотек, работы над основными принципами подготовки и представления информации в электронной форме были продолжены. Они привели к созданию концепции электронных библиотек, которая в полном объеме включила в себя концепцию электронных научных изданий.

Электронные издания на компактных оптических дисках

Одновременно с началом работ по созданию концепции полнотекстовой информационно–поисковой системы и разработки технологии подготовки информации для такой системы в 1994 г. были начаты практические работы по преобразованию печатной информации в электронную форму, а также выбор программных средств, обеспечивающих полнотекстовый поиск. В процессе подготовки электронной информации были опробованы четыре существовавшие в то время системы автоматического распознавания текста (OCR). Примерно через полтора года окончательный выбор пал на систему FineReader, которая в виде своих последующих модификаций и используется до настоящего времени. Сложнее обстояло дело со средствами полнотекстового информационного поиска — законченных программных продуктов, обеспечивающих качественную обработку русскоязычных текстов, еще не было. Первым шагом в решении этой проблемы стало создание информационно-поисковой системы «РЕГИСТР» на базе ИПС МИРС (руководитель разработки программного обеспечения системы — ). Эта система была рассчитана на использование в операционной системе MS-DOS, начиная с версии 5.0. Однако становилось ясным, что на рынке все большую популярность завоевывает операционная среда Windows, к работе с которой ИПС «РЕГИСТР» была не готова. Выход был предложен в 1996 г. компанией «CompTek International», отделение которой «Аркадия» уже разработала Windows–версию поисковой системы «Яндекс». С тех пор все наши продукты (на компактных оптических дисках или сетевые), оснащаются этой поисковой системой.

Полученные результаты исследований и экспериментов по перечисленным выше направлениям естественным образом привели к идее создания серии электронных научных изданий (ЭНИ) для определенной сферы деятельности. Эти издания должны были содержать основополагающие материалы, наиболее важные для данной предметной области, которые бы в электронной форме оптимально соответствовали печатным оригиналам. Электронные издания должны были выпускаться на компактных оптических дисках. Предшествующий опыт работ по стандартизации и сертификации в области баз и банков данных обусловил направленность первой серии электронных изданий — нормативные документы и классификаторы в области информатизации. В результате были созданы три ЭНИ: «Классификационные системы», «Информ–норматив» и «Библио–норматив». Развитием этого направления работ стало создание электронной библиотеки «Нормативная база ГСНТИ».

Стремление к освоению других тематических направлений привел к контактам в середине 1995 г. с Институтом мировой литературы им. РАН (ИМЛИ). В последующие годы эти контакты расширялись и укреплялись, что привело к тесному и плодотворному сотрудничеству двух организаций. Это взаимодействие положило начало работам по подготовке серии ЭНИ, посвященных классикам русской литературы. После подготовки двух ЭНИ: «Пушкин» и «Грибоедов» идея выпуска серии трансформировалась в проект создания Электронного фонда русской классической литературы. Этот проект, просуществовав два года, привел к созданию Фундаментальной электронной библиотеки «Русская литература и фольклор».

ЭНИ «Классификационные системы»

Электронное научное издание «Классификационные системы» создавался в 1994—95 гг. по заданию Миннауки РФ. ЭНИ было тиражировано на CD-ROM и находилось в коммерческом распространении в 1995—97 гг. Оно являлось первым в России машиночитаемым собранием разнообразных широко используемых классификационных систем (классификаторов):

· Универсальная десятичная классификация (УДК).

· Библиотечно-библиографическая классификация для научных (ББК-Н) и массовых (областных) библиотек (ББК-О).

· Международная классификация изобретений (МКИ), редакция 5.

· Государственный рубрикатор научно-технической информации (ГРНТИ).

· Классификатор научных специальностей ВАК (ВАК).

· Товарная номенклатура внешнеэкономической деятельности (ТН ВЭД).

· Общероссийский классификатор продукции (ОКП).

· Общероссийский классификатор видов экономической деятельности, продукции и услуг (ОКДП).

· Система обозначений объектов административно-территориального деления России (СОАТО).

· Система обозначений органов государственного управления России (СООГУ).

· Классификатор форм собственности (КФС).

· Классификатор организационно-правовых форм хозяйствующих субъектов (КОПФ).

· Классификатор стран мира (КСМ) - проект ГОСТ Р на базе стандарта ISO.

· Классификатор языков (КЯ) - проект ГОСТ Р на базе стандарта ISO.

· Общеправовой классификатор отраслей законодательства (ОКОЗ).

Информационные массивы перечисленных классификаторов были получены, как правило, у их владельцев или официальных держателей в объемах, соответствующих действующим официальным версиям, и актуализированы по состоянию на ноябрь 1994 г.

Все классификаторы представлены полными текстами в составе специализированной информационно-поисковой системы (ИПС РЕГИСТР), обеспечивающей поиск по лексике с учетом грамматики русского языка и классификационным кодам, просмотр результатов поиска, а также сохранение отобранной информации в текстовом файле. ИПС РЕГИСТР позволяет работать как с каждым классификатором отдельно, так и со всеми вместе. ЭНИ было рассчитано на эксплуатацию на IBM-совместимых персональных компьютерах, начиная с i386, в операционной системе MS-DOS, начиная с версии 5.0.

ЭНИ «Классификационные системы»

ЭНИ «Грибоедов» и «Пушкин»

ЭНИ «Грибоедов» посвящено жизни и творчеству классика русской литературы . Оно явилось дальнейшим развитием идей, сформированных при создании ЭНИ «Классификационные системы». Фактически это издание стало полигоном для отработки основных принципов и технологических решений создания ЭНИ.

В работе по созданию ЭНИ, выполненных в 1995—96 гг. принимали участие компания «CompTek International» и ИМЛИ им. РАН.

ЭНИ «Грибоедов» включало более 15 тысяч страниц печатной информации:

· полные тексты всех известных произведений Грибоедова по 5–10 наиболее авторитетным изданиям;

· полные тексты более 300 наиболее значимых работ о жизни и творчестве Грибоедова;

· библиографию Грибоедова и литературы о нем (около 10 тыс. описаний);

· летопись жизни и творчества Грибоедова;

· несколько указателей;

· около 400 изображений
и ряд других материалов.

В специальном разделе был представлен впервые подготовленный в России в полный словарь языка Грибоедова, содержащий около 13 тыс. лексем и более 130 тыс. словоупотреблений. Для каждой лексемы и словоформы представлены грамматические характеристики, каждое словоупотребление сопровождается контекстом. Полнота и точность представления информации в ЭНИ «Грибоедов» должна в полной мере обеспечить потребности квалифицированного специалиста–филолога.

Информационная система ЭНИ обеспечивает:

· работу с полными текстами различных видов,

· использование развитой системы гипертекстовых и гипермедийных связей,

· различные способы навигации во всем информационном пространстве издания,

· эффективные информационные поиски как по произвольным словам (словосочетаниям), так и по различным формальным признакам,

· удобный пользовательский интерфейс
и другие возможности.

В качестве для реализации полнотекстового информационного была использована поисковая система «Яндекс». ЭНИ «Грибоедов» был рассчитан на эксплуатацию на IBM-совместимых персональных компьютерах, начиная с i486 в операционной среде Windows 3.х/95.

***

Подготовка ЭНИ «Пушкин» была приурочена к 200-летнему юбилею поэта. Оно охватывало все творческое наследие Пушкина, сопровождаемое научным комментарием, фундаментальную научную библиографию, наиболее значимые работы о его жизни и творчестве. В ЭНИ были представлены изобразительные материалы (портреты, рисунки, фотографии), а так-же факсимиле пушкинских рукописей. Общий объем информации составил более 20 тыс. печатных страниц текста, около 400 изобразительных материалов и примерно 40 тыс. библиографических описаний. Подготовка ЭНИ «Пушкин» имело принципиальное значение не только как одно из юбилейных мероприятий. Во-первых, это издание было беспрецедентно по охвату материала и средствам работы с ним и, во-вторых, оно должно было отразить уровень развития информационных технологий и их связь с гуманитарными науками и культурой в целом. ЭНИ «Пушкин» было сопоставимо с такими национальными электронными изданиями мирового значения как «Шекспир» (Великобритания), «Гете» (Германия).

Работы по подготовке этого издания проводились в рамках программы подготовки Пушкинского юбилея. В реализации проекта помимо НТЦ «Информрегистр» принимали участие ИМЛИ им. РАН, РГГУ, РГБ и Центр ПИК. К работам были также привлечены компании «CompTek International» и «АНЕТ». Работы проводились в два этапа. На первом (завершение — май 1999 г.) подготовлена тиражируемая на CD-ROM версия электронного издания. На втором (завершение — декабрь 1999 г.) — подготовлена полная сетевая версия издания. Существенным отличием ЭНИ «Пушкин» от предыдущих разработок стала смена пользовательского интерфейса и изменение средств реализации некоторых функциональных возможностей. В информационной системе как в тиражируемом, так и в сетевом варианте стал использоваться стандартный браузер — MS Internet Explorer. Следует отметить, что эта замена привела к некоторому сокращению состава функциональных возможностей.

ЭНИ «Пушкин и Грибоедов»

ЭНИ «Информ–норматив», «Библио–норматив»

ЭНИ «Информ–норматив» было предназначено для обеспечения информационных центров, разработчиков различных информационных и программных продуктов, а также средств вычислительной техники, для специалистов, занятых разработкой стандартов в области информатики и вычислительной техники, комплексной информацией в машиночитаемой форме об отечественных и международных нормативных документов.

Подготовка этого издания осуществлялось в 1996—97 гг. при участии ИПК «Издательство стандартов» и компании «CompTek International». При его создании в полной мере использовались все научно-технические и технологические решения, полученные к тому времени при подготовке ЭНИ «Грибоедов». В частности, в нем была использована также информационная система и поисковая машина «Яндекс». В результате функциональные возможности этого издания совпали с основными функциональные возможности ЭНИ «Грибоедов».

ЭНИ «Информ–норматив»

Информационная база состояла из четырех частей: стандарты, правовые документы, классификаторы и словари. Первая часть — стандарты, содержала около описания более 2.5 тыс. стандартов, в числе которых стандарты ISO, IEC, CCITT, национальные стандарты США, России и др. Из этого числа около 200 стандартов были представлены полными текстами. Вторая часть — правовые документы, включала около 500 нормативно–правовых актов: законов, указов, постановлений и др., принятых за десять предшествующих лет. Все нормативные акты были представлены полными текстами. Правовые документы были сгруппированы в следующие рубрики: Конституция и конституционные законы, Кодексы, Законы РФ, Акты Президента и Правительства РФ, законы и акты иных органов. Третью часть составили четыре классификационные системы, представленные своими фрагментами, действующими в области информатики и вычислительной техники: ГРНТИ (Государственный рубрикатор научно-технической информации), УДК (Универсальная десятичная классификация), ОКП (Общероссийский классификатор продукции), ОКС (Общероссийский классификатор стандартов). В четвертую группу вошли два словаря по информатике: словарь сокращений и терминологический словарь. Основным источником словарных статей являются терминологические стандарты и терминологические приложения к стандартам.

ЭНИ было тиражировано на CD-ROM в 1997 г. и находилось в коммерческом распространении.

***

После успешного распространения ЭНИ «Информ–норматив» в 2000 г. было принято решение о подготовке на его основе нового электронного издания. Это ЭНИ должно было отличаться от предшественника, во-первых, актуальностью информации и, во-вторых, некоторым изменением состава его потенциальных потребителей. Электронное издание, получившее название «Библио–норматив», было предназначено для специалистов в области научно–технической информации, библиотекарей и издателей. В связи с этим в новое издание не вошли стандарты, имеющие чисто техническую направленность, но были введены новые материалы, представляющие интерес для указанных категорий потенциальных читателей.

В программном обеспечении ЭНИ «Библио–норматив» были использованы результаты работ, полученные за годы прошедшие после выпуска предыдущего издания, в частности результаты работ по ЭНИ «Пушкин». Кроме того, был существенно изменен пользовательский интерфейс.

ЭНИ «Библио–норматив» подготавливалось совместно с ВИНИТИ. Оно было тиражировано на CD-ROM и распространялось с конца 2001 г.

ЭНИ «Библио–норматив»

Другие проекты электронных изданий

В продолжения серии изданий на компактных оптических дисках, посвященных классикам русской литературы, в 1999 г. были начаты работы по созданию ЭНИ «Лермонтов» и «Тургенев». Для обоих электронных изданий были проведены подготовительные работы, включавшие разработку структуры изданий и подготовку перечней материалов, подлежащих представлению в электронной форме. Далее, в 2000—2001 гг., велась подготовка информации для ЭНИ «Лермонтов». Однако, ввиду готовящегося в 2002 г. открытия Фундаментальной электронной библиотеки «Русская литература и фольклор» было принято решение издание на компактном оптическом диске не выпускать, а всю подготовленную информацию разместить в соответствующем разделе электронной библиотеки. Работы по ЭНИ «Тургенев» из-за недостаточности финансирования продолжения не имели.

Одновременно с рассмотренными работами выполнялся в инициативном порядке проект по созданию коммерческого продукта по русской литературе. Фактически этот проект представлял собой развитие работ начатых при подготовке ЭНИ «Грибоедов» и «Пушкин», также предполагалось подготовить и выпустить на компактных оптических дисках серию электронных издания, каждое из которых было бы посвящено жизни и деятельности одного из великих русских писателей. Однако каждое издание должно было предоставляться пользователю в двух версиях: полной и облегченной. Первая была рассчитана на специалистов филологов, вторая — на учащихся. Т. о. электронное издание могло бы использоваться как в научной работе, так и в сфере образования. Кроме того, предполагалось наличие двух пользовательских интерфейсов: на русском и английском языках, что повысило бы интерес к этому проекту зарубежных читателей. За 2000—2001 гг. разработана концепция и состав серии электронных изданий, подготовлено программное обеспечение и сформирована демонстрационная версия на компактном оптическом диске. Однако отсутствие средств на полномасштабное развитие этого проекта и перевод специалистов, занятых в нем, на подготовку к открытию Фундаментальной электронной библиотеки «Русская литература и фольклор» не позволили продолжить начатые работы.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3