Министерство экономического развития Российской Федерации
Департамент государственного регулирования в экономике
аналитических исследований»
УТВЕРЖДАЮ:
Генеральный директор
_____________
«___»________________2010 г.
ПРОТОТИП АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ МЕЖВЕДОМСТВЕННОГО ОБМЕНА ИНФОРМАЦИЕЙ О ПЕРСОНАЛЬНЫХ ДАННЫХ
ТЕХНИЧЕСКИЙ ПРОЕКТ
ОПИСАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
в рамках выполнения второго этапа работ
по теме: Шифр 2115-09-10 «Выработка требований, механизмов и инструментов межведомственного обмена информацией»
Москва, 2010
АННОТАЦИЯ
В настоящем документе приводится описание программного обеспечения Прототипа Автоматизированной системы межведомственного обмена информацией о персональных данных (далее – Система).
Основанием для разработки Системы является Государственный контракт № 000-09-10 от «12» октября 2010 года.
При разработке настоящего документа использовался Руководящий документ по стандартизации РД 50-34.698-90.
Оглавление
1. Основные сведения.. 4
2. Структура программного обеспечения.. 5
2.1 Централизованное хранилище данных. 5
2.2 Подсистема интеграции с базами операторов ПД.. 5
2.3 Подсистема информационного обмена информацией о ПД.. 5
2.4 Подсистема консолидации информации о ПД.. 5
2.5 Подсистема анализа информации о ПД.. 6
2.6 Подсистема информационной безопасности и защиты информации о ПД 6
3. Функции частей программного обеспечения.. 7
3.1.1 Функции централизованного хранилища данных. 7
3.1.2 Функции подсистемы интеграции с базами операторов ПД.. 7
3.1.3 Функции подсистемы информационного обмена информацией о ПД 7
3.1.4 Функции подсистемы консолидации информации о ПД.. 8
3.1.5 Функции подсистемы анализа информации о ПД.. 8
3.1.6 Функции подсистемы информационной безопасности и защиты информации о ПД 8
4. Методы и средства разработки программного обеспечения 10
5. операционная система.. 15
6. средства, расширяющие возможности операционной системы 16
2. Основные сведения
Цель создания Системы – обеспечение автоматизации процесса межведомственного обмена информацией о персональных данных (далее – ПД) между Министерством здравоохранения и социального развития Российской Федерации (Минздравсоцразвития России), Государственной инспекцией безопасности дорожного движения Министерства внутренних дел Российской Федерации (ГИБДД МВД России) и Федеральной налоговой службой (ФНС России).
Система предназначена для осуществления хранения, обновления и консолидации метаданных участников межведомственного обмена информацией о персональных данных (далее операторов ПД), создания запросов на выдачу информации о ПД и аналитической обработки данных запросов.
Система обеспечивает решение следующих функциональных задач:
- создание, хранение и обновление метаданных операторов ПД;
- консолидацию метаданных операторов ПД;
- формирование шаблонов запросов на выдачу информации о ПД;
- аналитическую обработку сведений о статусе запросов на выдачу информации о ПД;
- интеграцию с базами данных операторов ПД;
-распределение прав доступа пользователей к хранимым метаданным операторов ПД и информационным ресурсам Системы.
Состав и требования к программно-техническим средствам системы приведены в пункте 3.5.10. документа «Пояснительная записка к техническому проекту».
Сведения об информационном обеспечении Системы приведены в документе «Описание информационного обеспечения системы».
3. Структура программного обеспечения
Система включает в себя следующие основные функциональные подсистемы:
- Централизованное хранилище данных;
- Подсистему интеграции с базами операторов ПД;
- Подсистему информационного обмена информацией о ПД;
- Подсистему консолидации информации о ПД;
- Подсистему анализа информации о ПД;
- Подсистему информационной безопасности и защиты информации о ПД.
3.1 Централизованное хранилище данных
Централизованное хранилище данных (ЦХД) обеспечивает создание, хранение и обновление метаданных, описывающих персональные данные операторов, а так же метаданных информационных ресурсов, определенных как базовые реестры в целях предоставления государственных и муниципальных услуг в электронной форме.
3.2 Подсистема интеграции с базами операторов ПД
Подсистема интеграции с базами операторов ПД обеспечивает отправку и получения пакетов метаданных с помощью веб-сервисов СМЭВ.
3.3 Подсистема информационного обмена информацией о ПД
Подсистема информационного обмена информацией о ПД обеспечивает формирование запросов на выдачу информации о персональных данных и ведение журнала межведомственного обмена информацией о персональных данных.
3.4 Подсистема консолидации информации о ПД
Подсистема консолидации информации о ПД обеспечивает обработку метаданных операторов ПД и актуализацию единого каталога метаданных.
3.5 Подсистема анализа информации о ПД
Подсистема анализа информации о ПД обеспечивает формирования графических и табличных представлений результатов аналитической обработки информации о запросах на выдачу информации о персональных данных, полученной из СМЭВ.
3.6 Подсистема информационной безопасности и защиты информации о ПД
Подсистема информационной безопасности и защиты информации о ПД обеспечивает распределение прав доступа пользователей к хранимым метаданным операторов ПД, объектам и функциям Системы, а так же ведение журнала регистрации.
4. Функции частей программного обеспечения
4.1.1 Функции централизованного хранилища данных
ЦХД обеспечивает выполнение следующих функций:
- создание метаданных операторов ПД;
- обновление метаданных операторов ПД;
- верификация файлов обновлений.
4.1.2 Функции подсистемы интеграции с базами операторов ПД
Данная подсистема обеспечивает выполнение следующих функций:
- получение и отправка пакетов метаданных между информационными Системами операторов ПД и Системой с помощью веб-сервисов СМЭВ.
4.1.3 Функции подсистемы информационного обмена информацией о ПД
Данная подсистема обеспечивает выполнение следующих функций:
- создание и сохранение шаблонов запросов на выдачу информации о персональных данных посредством просмотра единого каталога метаданных;
- редактирование и удаление шаблонов запросов на выдачу информации о персональных данных;
- ведение журнала межведомственного информационного обмена ПД между операторами ПД на основе данных протоколов СМЭВ об операциях межведомственного информационного обмена персональными данными, включая:
o учет отклоненных запросов на выдачу информации о персональных данных;
o учет стадии выполнения запросов на выдачу информации о персональных данных;
o учет выполненных запросов на выдачу информации о персональных данных;
o ведение архива запросов на выдачу информации о персональных данных.
4.1.4 Функции подсистемы консолидации информации о ПД
Данная подсистема обеспечивает выполнение следующих функций:
- обработка метаданных операторов персональных данных;
- формирование разделов единого каталога метаданных о персональных данных;
- обновление единого каталога метаданных о персональных данных.
4.1.5 Функции подсистемы анализа информации о ПД
Данная подсистема обеспечивает выполнение следующих функций:
- построение аналитических отчетов, определяющих структуру, объем данных и фактическую интенсивность информационного взаимодействия между операторами ПД, на основе запросов с табличным и графическим сопровождением;
- автоматическое обновление отчетов при изменении данных в ЦХД (с представлением отчетов по расписанию или по запросу);
- экспорт отчетов в приложения MS Excel и Word для аналитической обработки и последующего использования.
4.1.6 Функции подсистемы информационной безопасности и защиты информации о ПД
Данная подсистема обеспечивает выполнение следующих функций:
- идентификацию и аутентификацию пользователей с использованием комплекса соответствующих средств домена Active Directory на базе ОС Windows Server;
- авторизацию каждого пользователя и предоставление ему определенного набора прав и привилегий доступа к Системе, ее функциональным возможностям и хранимым метаданным операторов персональных данных;
- регистрацию всех действий пользователей в протоколе доступа.
5. Методы и средства разработки программного обеспечения
В ходе анализа входной информации Системы определено, что циркулирующие в Системе данные разнородны, но связаны между собой и имеют достаточно четкую иерархическую структуру. Для управления такими данными целесообразно использовать реляционные системы управления базами данных (СУБД), поддерживающие язык SQL для работы с данными и имеющие мощный встроенный процедурный язык. Также, в соответствии с требованиями к Системе, СУБД должна быть производительной и позволять хранить большое количество данных, справляться с большой нагрузкой, быть максимально отказоустойчивой, а в случае возникновения сбоев, обеспечивать сохранность данных.
Основными претендентами на использование в Системе были коммерческие базы данных - Oracle и Microsoft SQL Server, а также две ведущие базы данных с открытыми исходными кодами - PostgreSQL и MySQL.
СУБД PostgreSQL и MySQL являются аналогами уже зарекомендовавших себя коммерческих баз данных, таких как Oracle и Microsoft SQL, но MySQL чуть уступает по производительности и функциям.
PostgreSQL по производительности и встроенным функциям не уступает Oracle и Microsoft SQL, но имеет ряд существенных недостатков в ее использовании:
- отсутствие сертифицированного дистрибутива для Linux и Windows, что не может гарантировать корректную установку и работу ПО, например на Windows;
- отсутствие документации на русском, а это сложная СУБД и сложный язык, например встроенных функций она содержит более двух тысяч;
- за исправление ошибок PostgreSqL несет ответственность не конкретная организация, а сообщество программистов, и ошибки могут исправляться долго или вообще могут не исправляться;
- проблема локализации Unix систем присуща и этому продукту;
- идеология построения базируется на архитектуре Unix систем, которая отличается для Windows и не привычна для многих пользователей.
С учетом вышесказанного, основными претендентами на использование в Системе остались СУБД Oracle и SQL Server, являющиеся лидерами российского рынка реляционных СУБД.
Для повышения объективности метода при подготовке спецификаций тестов использовались исследования независимой организации Transaction Processing Performance Council (TPC. org (http://www. tpc. org)), занимающейся сравнительным анализом производительности СУБД.
Выбор СУБД проводится в три этапа:
Первый этап. Сравнение времени создания, загрузки и фильтрования таблиц (Рисунок 1). При этом предполагается выполнение следующих операций:
- один из блоков Системы, построенного на базе СУБД Oracle 10g, воссоздается средствами СУБД SQL Server 2005;
- версии блока Системы для тестирования, работающие под управлением СУБД Oracle 10g и СУБД SQL Server 2005, обрабатывают один и тот же набор данных. Фиксируется время, необходимое каждой из систем для выполнения различных задач;
- для сравнения эффективности испытываемых СУБД используется централизованное хранилище данных Системы;

Рисунок 1 . Результаты сравнения времени создания, загрузки и фильтрования таблиц СУБД Oracle 10g и СУБД SQL Server 2005
Второй этап. Сравнение времени отклика при работе в многопользовательском режиме (Рисунок 2). На одинаковых по структуре базах данных (8 связанных таблиц, общее количество записей - 9,6 млн.) протестированы 8 запросов, при этом имитируется одновременная работа 40, 70, 100 и 130 пользователей.

Рисунок 2 Результаты сравнения времени отклика при работе в многопользовательском режиме СУБД Oracle 10g и СУБД SQL Server 2005
Третий этап. Сравнение времени отклика при выполнении запроса поиска записи по разному количеству атрибутов (Рисунок 3). Как и на предыдущем этапе использовались две одинаковые по структуре базы данных под управлением Oracle 10g и SQL Server 2005 с тем же количеством записей, при этом поиск производился по 1, 2, 3 и 4 атрибутам. Для повышения скорости во время проведения этого теста в сравниваемых СУБД использовались индексы. На рис.3 также показаны средние арифметические результатов тестирования для каждой из СУБД.

Рисунок 3 Результаты сравнения времени отклика при выполнении запроса поиска записи по разному количеству атрибутов СУБД Oracle 10g и СУБД SQL Server 2005
Обоснованность методики оценки обусловлена проведением испытаний на базах данных реальных приложений. Для фиксации времени выполнения задач использовался специально написанный модуль-счетчик, обеспечивавший наивысший приоритет задачам тестирования, ограничивая выделение системных ресурсов другим задачам. Использование метода позволило рекомендовать для использования СУБД Oracle 10g, показавшей по совокупности всех тестов результаты, превосходящие СУБД SQL Server 2005.
Проектирование структуры базы данных Системы выполнено с использованием библиотеки Hibernate на основе объектно-реляционного подхода.
Для разработки компонентов Системы, отображаемых через web-интерфейс необходим язык программирования, специализированный для разработки распределенных web-приложений, и поддерживающий подход объектно-ориентированного программирования (далее ООП). В качестве языка программирования был выбран Java максимально удовлетворяющий требованиям к Системе.
6. операционная система
Для выделенного сервера баз данных Системы может быть использована следующая операционная система:
– Microsoft Windows Server 2003 R2.
Для клиентской части программного обеспечения Системы могут быть использованы следующие операционные системы:
– Microsoft Windows XP SP3 и выше.
7. средства, расширяющие возможности операционной системы
В состав программного обеспечения Системы не входят средства, расширяющие возможности операционной системы.


