, Т. Н. сТУКАЛОВА
Московский инженерно-физический институт (государственный университет)
ФОРМИРОВАНИЕ И ОРГАНИЗАЦИЯ ДОСТУПА
К ПОЛНОТЕКСТОВЫМ БАЗАМ ДАННЫХ ПО ТЕМАТИКЕ УНИВЕРСИТЕТА
В докладе рассказывается о создании полнотекстовых баз данных в научной библиотеке и об опыте автоматизации формирования полнотекстовой базы данных трудов Научных сессий МИФИ.
Объем информации в электронном виде в научной библиотеке МИФИ увеличивается с каждым годом. Это – полнотекстовые базы данных, мультимедийные энциклопедии, словари, справочники, обучающие программы, лабораторные практикумы, электронные копии традиционных изданий и мн. другое. Информация может быть размещена на серверах библиотеки или на удаленных сайтах. Доступ к ней может быть предоставлен в рамках локально-вычислительной сети (ЛВС) библиотеки, с компьютеров кафедр и подразделений университета или в сети Internet. Условия доступа определяются в соответствующих документах: договор с автором, соглашение, лицензия на использование и т. д. Информация эта может быть приобретенной или создаваемой сотрудниками библиотеки. Познакомиться с полнотекстовыми базами данных отечественных и зарубежных периодических изданий можно на сайте библиотеки (http://www. library. *****/). В настоящем докладе речь пойдет о базах данных, создаваемых сотрудниками библиотеки.
Полнотекстовые базы данных в библиотеке создаются в соответствии с приказом ректора № 000 от 01.01.2001 г. «О формировании фонда научной библиотеки электронными изданиями авторов МИФИ». На основании данного приказа в библиотеку передаются электронные копии всех внутривузовских изданий и ведется оцифровка учебников, учебных пособий, монографий авторов МИФИ повышенного спроса, а также редких изданий с целью сохранности и предоставления их электронных версий читателям.
В настоящее время в среде автоматизированной информационно-библиотечной системы (АИБС) «Ирбис» читателям предоставлены следующие базы данных (электронные каталоги) со ссылками на полный текст: «Книги», «Статьи научные», «Дипломное проектирование», «К семинарских занятиям», «Научные сессии МИФИ». АИБС «Ирбис» позволяет вести многоаспектный поиск документа, работать с его полным текстом, формировать различные выходные формы, например, список литературы (к реферату, дипломной, научной работе и т. д.) в соответствии с действующими стандартами на библиографическое описание документа.
Работа по созданию полнотекстовых баз трудоемкая, требует участия квалифицированных кадров и наличия специального оборудования для оцифровки фонда. Значительно упрощается технология, если издание передается в электронном виде автором, из редакционно-издательского отдела или из оргкомитета ежегодных Научных сессий МИФИ.
По материалам ежегодных Научных сессий МИФИ в библиотеке создается полнотекстовая база данных трудов. В настоящее время эта база содержит более 12000 записей со ссылками на полный текст. Создание полнотекстового архива одного года могло занимать от 2-х месяцев до полугода. Задача библиотеки - оперативно предоставлять информацию читателям, и такие сроки выполнения неприемлемы. Поэтому перед библиотекой остро стоял вопрос автоматизации этого процесса. Проблема была решена на уровне OLE-автоматизации Word.
Специально разработанная инженером библиотеки программа на C++ получает на вход файл в формате Word с текстом тома научных сессий. С помощью OLE-автоматизации Word, программа исследует структуру документа и автоматически распознает в документе отдельные статьи. Затем для каждой статьи программа, руководствуясь требованиями форматирования статей, распознает название статьи, авторов, организации авторов, краткое описание статьи, раздел в котором опубликована статья, страницы, аннотацию и т. д. В конце обработки, программа создает файл полностью готовый к импорту в АИБС «Ирбис». Более того, программа позволяет автоматически нарезать отдельные статьи, скопировать их в необходимый каталог электронных ресурсов и указать на каждую из статей ссылку в файле импорта. Таким образом, читатели оперативно получают доступ к библиографическому описанию и к полным текстам трудов в формате Word, а библиографы проводят постобработку записей, добавляя классификационные индексы УДК, ГРНТИ и недостающие ключевые слова. Помимо этого, с помощью данной программы и нескольких небольших транслирующих скриптов на Perl и PHP, автоматизирована публикация полных текстов научных сессий на сайте библиотеки МИФИ, http://www. library. *****/online-service/scientific-sessions/.


