Корпорация «ЭЛАР»

Возможности и перспективы

баз данных ОБД «Мемориал» и «Подвиг народа»

в деле установления судеб защитников отечества,

погибших и пропавших без вести в годы Великой Отечественной войны

Обобщенный компьютерный банк данных, содержащий информацию о защитниках Отечества, погибших и пропавших без вести в годы войны с нацизмом (ОБД «Мемориал»), создается Министерством обороны Российской Федерации с 2006 г. в соответствии с Перечнем поручений Президента Российской Федерации от 01.01.01 г. № пр-698 по вопросам организации военно-мемориальной работы в Российской Федерации и Указом от 01.01.01 г. № 37 «Вопросы увековечения памяти погибших при защите Отечества».

Общедоступный банк документов «Подвиг народа в Великой Отечественной войне г. г.» (сокращённо «Подвиг народа»), содержащий информацию о подвигах и наградах воинов Великой Отечественной войны и документы о ходе и итогах основных боевых операций, создается Министерством обороны Российской Федерации с 2010 г.

Техническим исполнителем работ является корпорация «ЭЛАР».

Отличием этих компьютерных банков от многочисленных баз данных является не только объём содержащейся в них информации, но в первую очередь то, что в банке представлены образы архивных документов, и любая запись базы данных сопровождается образами документа, из которого взяты данные в эту запись.

С момента размещения банков данных на сайтах www. ***** ( в начале 2007 г.) и www. podvignaroda. *****апреле 2010 г.) на сайтах зарегистрировано соответственно 28,5 и 12,3 млн. посещений. О статистике поговорим несколько позже, но уже эти цифры показывают, насколько востребована оказалась представленная информация.

НЕ нашли? Не то? Что вы ищете?

Поскольку к тематике данной конференции ОБД «Мемориал» имеет самое прямое отношение, я в своём докладе основное внимание уделю именно этому ресурсу, а об использовании «Подвиг народа» применительно к определению судеб скажу ближе к концу своего выступления.

Целью проекта ОБД «Мемориал» является:

- Установление судеб защитников отечества, погибших и пропавших без вести в годы войны с нацизмом;

- Установление мест захоронений погибших воинов;

- Предоставление возможности населению самостоятельно выяснять судьбы своих близких путем поиска и просмотра архивных документов через Интернет.

В банке на сегодня представлены документы из следующих российских организаций и архивов:

• Центральный архив Министерства обороны Российской Федерации (ЦА МО)

• Центральный военно-морской архив Министерства обороны Российской Федерации (ЦВМА)

• Военно-мемориальный центр Вооруженных сил Российской Федерации (ВМЦ ВС РФ), ныне – Управление Министерства обороны РФ по увековечению погибших при защите Отечества

• Российский государственный военный архив (РГВА)

• Государственный архив Российской Федерации (ГА РФ) и его региональные отделения

• Областные военкоматы Архангельской области и республики Татарстан

Основные массивы документов, содержащиеся в ОБД «Мемориал», составляют:

- донесения о безвозвратных потерях, которые армейские части обязаны были регулярно представлять в Центральное бюро учета потерь на фронтах Главного управления формирования и укомплектования войск. Это документы непосредственно с мест боевых событий. Причем донесения эти составлялись на уровне отдельных батальонов, полков, дивизий, армий. В них, кроме ФИО и звания, должны были указываться данные о годе и месте рождения, дате и месте призыва на воинскую службу, подразделении, в котором проходил службу, должности, месте и причине выбытия, месте захоронения в случае смерти, месте жительства и имени родственника (более 250 тыс. донесений);

- книги госпиталей и медсанбатов, в которых фиксировались смерти и захоронения (более 10000 томов);

- современные паспорта воинских захоронений со списками захороненных. В них указаны сегодняшние захоронения, в том числе мемориальные кладбища с указанием мест, откуда производились перезахоронения (более 42 тыс. паспортов);

- приказы об исключении офицеров из списков личного состава (1,4 млн. записей);

- карточки и списки на советских заключенных, составленные в нацистских концлагерях (1,3 млн. записей);

- анкеты и списки пропавших без вести бойцов, составленные после окончания войны в результате подворных опросов.

Кроме того, в ОБД «Мемориал» перенесены содержащиеся в архивных делах неврученные извещения о гибели или пропаже без вести, списки освобожденных из плена и окружения, документы об оказавшихся в живых бойцах, ранее зачисленных в погибшие или пропавшие.

В качестве вспомогательного массива с отдельным поиском в ОБД «Мемориал» загружаются документы военно-пересыльных пунктов и запасных полков и дивизий, позволяющие определить, куда был направлен военнослужащий, что может указать дополнительное направление поиска в случае, когда неизвестно, в какой части воевал пропавший без вести воин.

Дополнительно к архивным источникам в ОБД «Мемориал» загружено более тысячи региональных печатных изданий Книги Памяти, причем в тех случаях, когда позволяло качество печати, сформированы записи базы данных на указанных в книгах людей (10,9 млн. записей).

Основная особенность банка данных, как уже упоминалось, – наличие в нем не только информации о людях в базе данных, но и образов документов, из которых взята эта информация. Каждая запись базы данных сопровождается образами документа, из которого взята информация. Причем на каждого человека заводится столько записей, сколько раз он упоминается в документах. Информация в различных документах может различаться и по содержанию, и по степени детализации, и часто трудно понять, об одном и том же человеке идет речь, или о разных.

За период с конца 2006 в ОБД «Мемориал» загружено 14,5 млн. образов и около 31 млн. записей о персоналиях из 38 тысяч архивных дел и картотек, а также из 42 тысяч паспортов воинских захоронений.

Совмещение в одном информационном массиве различных документов, в первую очередь донесений о безвозвратных потерях, паспортов современных захоронений и карточек советских военнопленных позволило тысячам людей самостоятельно определить судьбу и найти места захоронения своих близких

Для создания ОБД «Мемориал» потребовалось разработать специальные технологии и создать несколько цехов обработки информации. У корпорации «ЭЛАР» к началу работ уже имелся 10-летний опыт перевода документов с бумаги и микроносителей в форматы электронных баз данных и архивов, благодаря которому уже в конце 2006 г. первые 1,5 млн. записей и соответствующие им документы были выставлены в интернет, а к концу 2007 г. количество созданных записей перевалило за 20 млн.

Первая стадия обработки – сканирование документов – осуществлялась с использованием специальных промышленных сканеров и штата профессиональных сканировщиков. При этом требовалось расшивать архивные дела, чтобы не потерять информацию при сканировании, и впоследствии заново сшивать их. Работа велась как непосредственно в архивах, куда было завезено оборудование, так и в специализированных центрах сканирования корпорации «ЭЛАР».

На втором этапе специально обученные операторы выделяли из отсканированных образов индексную информацию. Работа велась как в центрах ретроконверсии корпорации «ЭЛАР», созданных в нескольких городах России, так и с привлечением нескольких тысяч надомников через Интернет. Отдельные группы операторов занимались поиском в документах и обработкой конкретных полей. Таким образом, один документ обрабатывали несколько операторов. Кроме того, осуществлялась обязательная проверка введенной информации, как автоматическая, так и ручная. Это позволило существенно снизить количество ошибок, присущих ручному вводу.

Об ошибках стоит поговорить отдельно. Совершенно очевидно, что избежать их невозможно. Это связано и с плохим качеством сохранившихся документов, и с имеющимися почерками, которые часто невозможно разобрать (а в условиях конвейерной работы времени на исследования нет). Да и в самих текстах документов большое количество ошибок, связанное как с неточной информацией, так и с неграмотностью писарей, составлявших эти документы. Различные технологические приемы могут уменьшить количество ошибок ввода, но ошибки в тексте документов при индексировании сохранятся. И здесь наличие образов источников оказывает неоценимую помощь при анализе: изучение самого документа позволяет как уточнить идентификацию, так и сделать вывод о причине ошибки.

Наличие образов документов позволяет также гибче подойти к проблеме индексирования информации. Как правило, перенос полной информации о человеке из документа связан с большими трудозатратами (то есть стоимостью работ) и временем исполнения. Имея в доступе образы, можно выбрать набор полей для обязательного индексирования, а остальную информацию не индексировать, а предоставить для просмотра на образах. Выбор полей для индексирования, безусловно, очень важен, так как он определяет эффективность поиска при различных запросах, но когда приходится втискиваться в заданные ограничения, ничего не остается, и чем-то приходится жертвовать. Однако всю не проиндексированную информацию можно увидеть на образах документов. В нашем случае не индексировалась информация о родственниках, месте жительства до призыва, для определенных типов документов – о месте выбытия и захоронения. Последние указанные поля существенно ограничили возможность поиска погибших в конкретном месте, районе, регионе. Однако эта информация в документах настолько не структурирована, что индексирование ее – отдельная задача, которая планируется на следующих этапах работ, а простое перенесение в индексные поля текста, указанного в документе, часто не помогает в поиске.

В то же время индексирование поля «Место призыва» с использованием довоенных и военных справочников позволило сделать выборки из ОБД «Мемориал» по призванным из союзных республик, являющихся ныне странами СНГ. Диски с выборками были переданы руководству стран. Объём выборки по Украине составил 2,86 млн. записей.

В процессе эксплуатации ОБД «Мемориал» мы стали получать письма не только с информацией о результатах поиска, но и с сообщениями об обнаруженных ошибках, о дополнительных сведениях, не отраженных в представленных документах. Ошибки ввода мы брали на исправление, а вот про остальную информацию встал вопрос, как с ней быть. Ведь это не мемориальная база данных, а банк архивных документов, которые мы не можем исправлять и пополнять. В результате было принято решение дополнить программное обеспечение ОБД отдельным модулем, позволяющим принимать и хранить информацию от пользователей, причем не только текстовую, но и графические образы, ссылки на интернет-источники. После проверки модераторами эта информация выставляется в открытый доступ. По ней невозможен поиск записей, но при попадании на запись другим путём дополнительная информация доступна для просмотра всем желающим.

Возможность пользователям самостоятельно проводить исследования, задавать различные варианты запросов, в том числе с учетом предположительных искажений данных, оказалась очень эффективной. Нам неоднократно приходили письма, в которых кроме благодарности за возможность найти информацию, сообщалось, что фамилия бойца не та, что написана в документе. Но, тем не менее, люди смогли найти!

Немного статистики. Сбор ее для ОБД «Мемориал» был включен 21 марта 2007 г., когда ОБД уже несколько месяцев эксплуатировалась. На сегодняшний день на сайте зафиксировано 28,5 млн. посещений, которые совершили почти 10,5 млн. различных посетителей более чем из 150 стран (случайные входы отброшены). Больше всего посещений, разумеется, из России – 21,7 млн., 76%, на втором месте – Украина – 3,23 млн., 11,3% млн. Что касается различных городов, из которых выходили на сайт, то их более 11 тысяч. На первом месте Москва – 5,6 млн., на втором – Санкт-Петербург – 2 млн., на третьем – Киев - 1 млн. За последний месяц, в среднем, ежедневно на сайте регистрировалось 15 тыс. посещений.

Теперь о том, чего на сайте не хватает. Несмотря на то, что фонд безвозвратных потерь ЦА МО обработан полностью, загружены и донесения о потерях, и результаты подворных опросов, многие имена до сих пор отсутствуют в ОБД «Мемориал». А для многих из тех, чьи имена присутствуют, не указаны судьба, место захоронения. Часть донесений, не попавших в ОБД «Мемориал», возможно, удастся найти в фондах отдельных частей, но это сложная кропотливая работа, которую почти невозможно сделать без предварительной автоматизации архивных описей. Но, пожалуй, отдельный вопрос – паспорта воинских захоронений и документы о советских военнопленных.

Паспорта захоронений начали создаваться в 1991 г., но с распадом СССР часть их так и не была передана в Москву. Этот касается всей Прибалтики, Молдавии, частично Украины, а также республик Закавказья и Средней Азии, где находились эвакогоспитали. Да и из РСФСР были получены паспорта далеко не по всем захоронениям. Что касается Дальнего Зарубежья, то паспорта были получены из социалистических стран и Австрии, причём из Польши – без списков захороненных (а это порядка 600 тыс. имён). Сейчас в странах Европы работают представительства Министерства обороны РФ, паспорта со списками составляются, в том числе по захоронениям Польши и Западной Германии, списки которых отсутствуют в ОБД «Мемориал». В ближайшее время должны быть загружены паспорта, поступившие в Министерство обороны РФ в 2011 и 2012 гг. Но вот, например, по Киеву и Киевской области ни одного паспорта воинского захоронения в ОБД «Мемориал» нет, по Черновицкой области – только 58 паспортов, по Крыму охвачены только Керчь, Феодосия, Судакский район и Севастополь. Это при том, что в целом по Украине загружено 13 тыс. паспортов. Всего сейчас списки к паспортам воинских захоронений охватывают чуть более 2,5 млн. имён. Это, конечно, очень мало.

Что касается советских военнопленных, то информация о них не централизована, а разбросана по архивам различных стран и городов. Складывается парадоксальная ситуация: у нас есть информация по части лагерей на территории Германии и Польши, но очень мало сведений о лагерях на территории Советского Союза. И здесь хотелось бы рассчитывать на помощь украинских архивов, в которых имеются документы со списками погибших и заключённых.

Также чрезвычайно важным является загрузка в ОБД «Мемориал» сохранившихся в военкоматах похоронных извещений. В ЦАМО хранятся только похоронки, попавшие туда либо по причине невручения, либо повторные, либо дезавуированные (выписанные ошибочно). А уже обработка похоронок из Архангельской области и Татарстана показала, что в этих массивах встречаются как имена, не отражённые в имеющихся документах, так и дополнительная информация – например, место первичного захоронения – к имеющимся записям.

Работа над ОБД «Мемориал» продолжается.

Мы нуждаемся в любых официальных разрешенных к публикации в ОБД «Мемориал» документах (архивов, кладбищ) с информацией о судьбах воинов (данные о нахождении в плену, смерти, захоронении, документы о фильтрационной проверке после плена или окружения, показывающие, что человек вернулся, а не пропал на войне).

И в завершении – несколько слов о ресурсе «Подвиг народа». Казалось бы, как он может помочь в поиске? И тем не менее, помогает. Для каждого награждённого в этом ресурсе указано место службы, для некоторых – что награждение сделано посмертно, и при описании подвига сказано, где он погиб. Про часть бойцов, родные которых ничего не знали про них с момента ухода на фронт, информация о награждении становится первой зацепкой, от которой можно начинать поиски.

Ресурс сейчас содержит информацию о 12,67 млн. награждений боевыми орденами и медалями «За отвагу» и «За боевые заслуги» из фондов ЦА МО и ЦВМА (это не считая учетной картотеки награждений ЦА МО и юбилейной картотеки награждения ветеранов к сорокалетию Победы»). На сайт ежедневно заходят 10-12 тыс. посетителей.

Работа над пополнением этого сайта также будет продолжена.

– Корпорация «ЭЛАР», руководитель Центра проектирования информационных ресурсов, технический директор проекта ОБД «Мемориал»