Заместитель директора Челябинской областной универсальной научной библиотеки

Использование базы данных «Вся Россия» в процессе ретроконверсии карточного каталога

Сегодня мы снова возвращаемся к проблеме ретроконверсии карточного каталога. Проблеме, пугающей своими объемами и, следовательно, трудозатратами, но требующей безотлагательного решения.

Два традиционных решения:

·  отдать всю работу сторонней организации;

·  делать самостоятельно.

Если отдать работу сторонней организации, то сможет ли она выполнить весь объём по ретроконверсии?

Что придется доделывать самостоятельно?

Что может сделать только библиотекарь, обслуживающий карточный каталог?

Попробуем оценить объем работы на примере генерального каталога Челябинской областной универсальной научной библиотеки:

ГАК библиотеки содержит примерно 800 000 библиографических описаний, которые размещены в 1400 ящиках.

Опыт библиотек, которым ретроконверсию проводили сторонние организации (ВГБИЛ, РНБ, Курганская областная универсальная научная библиотека) показывает, что в процессе работы самой библиотеке приходится выполнять большой объем работ.

Нами при подготовке к ретроконверсии были выделены следующие этапы:

Этап первый. Суть его состоит в том, чтобы разобраться с информацией, хранящейся на обороте карточки. Это работа, которую может выполнить только библиотекарь, хорошо знакомый с традициями создания и ведения данного, и я подчеркиваю, ДАННОГО, бумажного генерального каталога. Библиотекарь, знающий все нюансы меняющихся условных обозначений и пометок на карточках. В первую очередь это касается топологии книги: условностей простановки инвентарных номеров, сигл хранения. Разные библиографические карточки хранит Генеральный каталог. Как живой организм он хранит память обо всех, кто к нему прикасался: он помнить высококвалифици­рован­ных, ответственных, с разборчивым почерком библиотекарей. И сделанные ими карточки просто обрабатывать. Но и, что скрывать, на нем остались и следы ошибок библиотекарей. И самая главная и трудоемкая работа состоит в том, чтобы выявить их, и не пропустить в электронный каталог.

НЕ нашли? Не то? Что вы ищете?

Я уверен, что ни одна сторонняя организация с этой работой не справится. Это самый трудоемкий и ответственный этап ретроконверсии. Проблема усугубляется тем, что специалисты, которые в состоянии выполнить эту работу естественным образом покидают нас. И завтра, уже завтра, качественно выполнить её будет некому.

Второй этап - этап собственно ретороконверсии библиографического описания. Это наиболее простой этап, и он может быть поручен любому оператору, прошедшему минимальное обучение. Хотя трудозатраты на его реализацию самые значительные.

Третий этап включает в себя контроль за выполненной работой и передачи библиографического описания в электронный каталог. Эту работу тоже будут выполнять работники библиотеки, но уже отвечающие за ведение электронного каталога. Таким образом, эстафетная палочка передается от бумажного к электронному каталогу.

Итак, два этапа из трех (первый и третий) в любых случаях придется выполнять библиотеке собственными силами.

В Челябинской областной универсальной библиотеке апробирована технология ретороконверсии, при которой на втором этапе библиографические описания заимствуются из базы данных «Вся Россия», хранящейся в центре ЛИБНЕТ.

Опишем её этапы подробнее.

1. Двухстороннее сканирование библиографической карточки генерального каталога. Оно выполняется на двухстороннем листовом сканере с автоподачей и аппаратной коррекцией. Сканирование проводится с разрешением 150 dpi в 256 оттенков серого цвета.

Рис 1. Папка scan, содержащая отсканированные библиографические карточки 2 ящика генерального каталога. Нечетные номера – оборот карточки. На левой панели представлена папка с программами и файлами настройки, используемыми в процессе ретроконверсии.

2. Проверка достоверности информации, зафиксированной на карточке, создание временного электронного документа, связывающего графический образ с инвентарными номерами и сиглами хранения конкретных экземпляров книг, проверка на наличие библиографического описания в электронном каталоге. При этом вся информация, хранящаяся на обороте карточки преобразуется в электронный вид. Графический образ оборота карточки исключается из дальнейшей обработки.

Рис. 2. Окно программы, в которой библиотекарь просматривает отсканированные карточки.

В своей работе библиотекарь имеет возможность просматривать лицевые и оборотные стороны библиотечных карточек, проставлять в окна формы сиглы хранения, инвентарные номера, формат расстановки. В левой части экрана расположена информация, позволяющая определить сиглы хранения части документов и инвентарные номера книг, информация о которых уже внесена в электронный каталог.

Рис. 3. Оборот карточки, представленный на рис. 2.

В процессе работы библиотекарь либо допускает библиографическую карточку к дальнейшей обработке, нажимая кнопку «Обрабатываем», либо отбрасывает её, нажимая на кнопку «Следующая».

Рис. 3. Предупреждение программы о том, что библиографическое описание с таким инвентарным номером уже есть в электронном каталоге.

Если запись о книге с вводимым инвентарным номером, присутствует в электронном каталоге, то программа выводит предупреждение об этом. См. рис. 3.

3. Графический образ подвергается обработке с целью преобразования информации, хранящейся на нем в текстовую форму, из которой с помощью специального фильтра предпринимается попутка извлечь минимальную информацию: такую как автор, название, год издания. Результат работы фильтра хранится во временном электронном документе созданном на 2 этапе, дополняя ранее созданную информацию.

Рис. 4. Результат обработки графического изображения программой «FineReader»

Рис. 5. Результат работы программы фильтра помещенный в файл, который связывает графический образ библиографической карточки с результатами обработки.

4. Результат работы фильтра подвергается проверке, в ходе которой вручную корректируется работа фильтра, вносится другая информация, необходимая для дальнейшего использования.

Рис. 6. Окно программы, в которой проверяется достоверность работы программы фильтра.

Был проведен анализ работы фильтра, в задачу которого входило выделение из текста следующей информации:

·  Автора: первого и, если есть, второго.

·  Заглавия издания или его части.

·  Года издания.

При числе карточек, допущенных к обработке равном ящик ГАК), из них:

·  печатные – 334,

·  изготовленные на пишущей машинке – 44,

·  рукописные -37,

распознано программой «FineReader» - 412, отфильтровано без ошибок – 199.

Запрос к базе «Вся Россия» формируется из фамилии первого автора, части заглавия и года издания. И только эту информацию следовало бы контролировать. Но если поиск будет безрезультатным, то только эта информация и будет в дальнейшем использоваться для работы. Поэтому принято решение о том, что вводится полная информация об авторах, включая полные имена, полное заглавие, год издания и номер тома для многотомного издания.

5. Специальная программа на основании информации, хранящейся во временном электронном документе, делает запрос в базу «Вся Россия» и извлекает библиографическое описание в формате RUSMARC. При этом информация, ранее полученная на предыдущих этапах, преобразуется в соответствующие поля формата.

Формируется файл для загрузки в АБИС, в нашем случае это ИРБИС, при этом связь с графическим образом бумажной библиографической карточки не разрывается. Если поиск прошел безрезультатно, то в АБИС будет загружен минимальный набор библиографических элементов, созданных на предыдущих этапах совместно с графическим образом.

Рис. 7. Окно программы поиска библиографических описаний в базе «Вся Россия» центра ЛИБНЕТ.

На рисунках 8 и 9 приведен результат работы программы поиска и извлечения библиографических записей. Записи подготовлены для загрузки в программы ИРБИС.

Рис. 8. Пример библиографической записи в случае неудачного поиска.

Рис. 9. Пример заимствованной библиографической записи.

6. Уже в АБИС, штатно используемой в библиотеке, проводится окончательный анализ результатов ретроконверсии и принимается решение о переносе записи в основной каталог или её доработке. Возможен повторный запрос в базу через определенное время для поиска библиографического описания.

Таким образом, формируется гибридный электронный каталог, в котором краткое или полное библиографическое описание связано с графическим образом бумажной библиографической карточки.

Рис. 9. Библиографическая запись, полученная в результате ретроконверсии в случае неудачного поиска в базе «Вся Россия»

Рис. 10. Библиографическая запись, полученная в результате ретроконверсии в случае удачного поиска в базе «Вся Россия»

При необходимости этап поиска и извлечения записей может быть повторен спустя определенное время, после существенного пополнения базы «Вся Россия».

Подведем итоги.

Временные затраты на ретроконверсию Генерального каталога Челябинской областной универсальной научной библиотеки по описанной технологии. В качестве учетной единицы был выбран один ящик Генерального каталога библиотеки (от 500 до 600 библиографических карточек):

Операция

Временные затраты на обработ­ку одной учетной единицы (час)

1.

Двухстороннее сканирование библиографической карточки

0,75

2.

Предварительная обработка (см. 2 этап)

Ручной перенос информации содержащейся на обороте карточки в электронный вид

6

3.

Автоматическое преобразование графического образа карточки в текстовый формат

3

4.

Автоматическое выделение основных элементов библиографического описания

1

5.

Доработка результата распознавания и выделения

Ручная корректировка информации

3

6.

Поиск и заимствование библиографических описаний из каталога «Вся Россия» центра «ЛИБНЕТ»

4

7.

Загрузка библиографических описаний в АБИС «ИРБИС»

1

8.

Проверка корректности заимствования и перенос записей в электронный каталог библиотеки

6

При определении общих трудозатрат следует разделить перечисленные в таблице работы на три категории:

·  Обработка учетной единицы после подготовки задания автоматически (не требуется присутствие оператора);

·  Ручная обработка каждого графического библиографического описания;

·  Вспомогательные операции: копирование, преобразование форматов и т. п.

Операции 3, 4, 7 могут выполняться параллельно одним оператором при обработке нескольких условных единиц. Они предполагают использование оператора. Но, чем больше библиотекарей заняты в операциях 2, 3, 8, тем меньше вклад этого оператора в общие затраты.

Требование к квалификации:

Операция 1 – техник;

Операция 2 – опытный библиотекарь отдела обработки, знающий все нюансы создания бумажного карточного каталога.

Операции 3, 4, 6, 7 – программист;

Операция 5 – библиотекарь;

Операция 8 – опытный библиотекарь отдела обработки.

Общие затраты:

По указанной технологии на обработку 1 ящика ГАК требуется 20 человеко-часов.

На обработку всего ГАК требуется 28 000 человеко-часов.

При работе 1 библиотекаря 6 часов в день, определим месячный фонд в размере 120 часов.

Тогда общие трудозатраты составят 233 человеко-месяца.

В результате выполнения указанных операций будет, как минимум, создан качественный топографический каталог, содержащий графические образы библиографических карточек ГАКа.