СИСТЕМЫ КОНТРОЛЯ КАЧЕСТВА РАБОТЫ ЕДИНОЙ ГОСУДАРСТВЕННОЙ СИСТЕМЫ ИНФОРМАЦИИ ОБ ОБСТАНОВКЕ В МИРОВОМ ОКЕАНЕ
, ФГБУ «ВНИИГМИ-МЦД», г. Обнинск
В настоящее время существует довольно обширный ряд проблем, влияющих на качество работы Единой государственной системы информации об обстановке в Мировом океане (ЕСИМО) в целом.
Первая группа проблем связана с используемой системой мониторинга ресурсов и сервисов (МРС), основанной на средствах IBM Tivoli Monitoring, которые представляют собой сложный и дорогой аппаратно-программный комплекс. Главной трудностью здесь является низкая квалификация администраторов центров ЕСИМО. Для полноценного администрирования необходимо провести обучающие курсы. Вторая - является
наиболее критичной для выполняемых функций и связана с ложными срабатываниями системы на критические события. Периодически возникают большие рассылки сообщений о неработоспособности серверов, не соответствующие истине. Третья - возникает при работе
с порталом системы мониторинга. Его работа оптимизирована для одного браузера (Mozilla
Firefox) и требует ряда разрешений на запуск. Четвертая - возникает при мониторинге сетевых соединений. Сейчас он не осуществляется средствами АПК МРС по техническим причинам.
Вторая группа проблем связана с оценкой доступности ресурсов. Для решения этой задачи
используется механизм опроса, реализованный в аппаратно-программном комплексе (АПК) Сервер интеграции. Процедура сбора данных проводится ежедневно и занимает несколько часов. При этом для архивных ресурсов эта процедура избыточна, а для оперативных — недостаточна. При определенных режимах работы (использование копий ресурсов - кеша) в АПК Поставщик данных ресурс может быть указан как доступный, при этом не доставляться на АПК Сервер интеграции. Также отсутствует агрегация данных, что мешает быстрому анализу и принятию
решений.
Третья группа проблем связана с контролем актуальности данных. На текущий момент
отсутствуют технические средства контроля актуальности данных, используемых в ресурсах. Сейчас осуществляется ручной контроль актуальности наиболее оперативных данных, что делает их также слабо пригодными для анализа и принятия решений.
Четвертая группа проблем связна с отсутствием централизованной системы помощи по ЕСИМО
(службы ServiceDesk). В связи с этим разработчики аппаратно-программных комплексов вынуждены тратить значительную часть рабочего времени на решение вопросов по эксплуатации
вместо планомерного улучшения качества АПК.
Пятая группа проблем связана с проблемами организационного характера. Ввиду отсутствия полной картины о работе ЕСИМО руководство не может принять оперативных мер и корректно повлиять на ситуацию. При этом из виду уходят такие вещи, как устаревающие или
сломанные сервера, неоплаченные лицензии на программное обеспечение и прочие организационные моменты.
Создание системы контроля качества работы ЕСИМО даст ряд преимуществ для системы в целом:
- соответствие контроля качества к существующему международному стандарту ISO 9001:2008
и российскому стандарту ГОСТ Р ИСО ;
- организационный порядок по управлению качеством работы ЕСИМО;
- служба ServiceDesk для решения вопросов по работе с ЕСИМО;
- единая точка сбора информации о качестве работы ЕСИМО;
- автоматизация сбора большего числа метрик;
- приведение информации о качестве в удобный для восприятия и анализа вид;
- организация надежной системы предупреждений о критических ситуациях.
В связи с этим создание системы контроля качества ЕСИМО является необходимой и актуальной задачей краткосрочной перспективы.
Конечным потребителям информации, получаемой из ЕСИМО важны следующие критерии работы системы:
- полноценный доступ к системе в любое время суток;
- качественная и достоверная информация ресурсов, доступная в любое время суток;
- высокая скорость доставки информации и производной продукции;
- своевременная квалифицированная помощь при работе с системой.
Для обеспечения полноценного доступа к ЕСИМО должна существовать деятельность по
эксплуатации и модернизации АПК центров.
Деятельность по эксплуатации АПК центров состоит из процессов эксплуатации сетевых соединений, эксплуатации аппаратного обеспечения и эксплуатации программного обеспечения. Процесс эксплуатации сетевых соединений содержит активности поддержания соединения центра с глобальной сетью Интернет, поддержание защищенного
VPN-соединения, поддержание сетевого соединения между серверами центра. Процесс эксплуатации аппаратного обеспечения содержит активности поддержания электрического снабжения
серверов, поддержания корректных климатических условий работы серверов, поддержания в работоспособном состоянии процессоров серверов, поддержания в работоспособном состоянии оперативной памяти серверов, поддержания в работоспособном состоянии жестких дисков серверов и поддержания в работоспособном состоянии внутренних систем охлаждения серверов. Процесс эксплуатации программного обеспечения содержит активности поддержания в работоспособном состоянии операционной системы сервера, поддержания в работоспособном состоянии баз данных, поддержания в работоспособном состоянии серверов приложений, поддержания в работоспособном состоянии приложений ЕСИМО.
Деятельность по модернизации аппаратно-программных комплексов центров состоит из процессов обновления сетевого оборудования, обновления аппаратного обеспечения, обновления программного обеспечения, разработки обновлений приложений ЕСИМО. Процесс обновления
сетевого оборудования должен включать в себя активности по увеличению надежности работы соединения центра с глобальной сетью Интернет, повышению надежности работы защищенного
VPN-соединения, сетевых соединений между серверами центра, увеличению скорости работы соединения центра с глобальной сетью Интернет, увеличению скорости работы защищенного VPN-соединения, увеличению скорости работы сетевого соединения между серверами центра. Процесс обновления аппаратного обеспечения состоит из активностей ввода в эксплуатацию нового оборудования, обновления существующего, повышения
надежности работы аппаратного обеспечения, повышения скорости работы аппаратного обеспечения, вывода из эксплуатации устаревшего оборудования. Процесс обновления программного
обеспечения состоит из активностей обновления операционных систем, систем управления базами данных, серверов приложений, приложений ЕСИМО. Процесс разработки
обновлений программного обеспечения состоит из активности устранения ошибок работы программного обеспечения и реализации новых функции в соответствии с планом.
Для обеспечения пользователей качественной и достоверной информацией, доступной в любое время суток, должны существовать деятельности по контролю качества информации и по доступности информационных ресурсов. Деятельность по контролю качеству состоит из активностей регистрации ресурсов в соответствии с планом, контроля данных ресурсов, контроля метаданных ресурсов. Деятельность по контролю доступности ресурсов включает в себя активности по проверке готовности источников данных, контроля цепочек распространения ресурсов
ЕСИМО.
Для обеспечения высокой скорости доставки информации и производной продукции должна
существовать деятельность по контролю времени доставки информации, времени
генерации производной продукции, объемов передаваемой информации, количества ресурсов. Деятельность по контролю времени доставки информации состоит из
активностей измерения времени доставки каждого ресурса до каждого из АПК. Деятельность по контролю времени генерации производной продукции состоит из активностей измерения времени генерации ресурсов в Базе интегрированных данных, Аналитическом комплексе, ГИС сервере. Деятельность по контролю количеству ресурсов должна состоять из измерений количества ресурсов каждого центра ЕСИМО.
Для обеспечения поддержки пользователей должны существовать деятельность по приему
и решению запросов. Деятельность по приему и решению запросов должны включать активности по контролю количества входящих запросов, измерения времени решения запросов и контроля количества решенных запросов, наиболее активно используемых ресурсов и др.
Исходя из приведенной выше задач для создания системы контроля качества следует:
- организовать недостающие процессы, деятельности и активности;
- составить для каждой активности метрики;
- развернуть надежное средство сбора, агрегации и анализа метрик.


