Повышение достоверности учета и прогнозирования параметров населения.

Increasing the reliability of the population registration and of forecasting population parameters.

Алёшкин Е.

Aleshkin E. F.

Важнейшим ресурсом любого государства является его население. С точки зрения развития экономики страны человеческие ресурсы играют двуединую роль. С одной стороны – это активная часть производительных сил, источник формирования доходной части бюджета государства. С другой стороны – это объект прямых и косвенных затрат. В связи с этим для формирования обоснованных планов социально-экономического развития страны в целом или ее отдельных территориальных образований необходимо иметь полную и достоверную информацию о населении соответствующей территории, а также о факторах, влияющих на демографические процессы.

Переписи населения, периодически проводящиеся в нашей стране, позволяют получать оценки количественного и качественного состава населения территорий в составе России. Однако, достоверность таких оценок (вследствие ряда методических и инструментальных погрешностей) недостаточна [1].

Существенный прогресс в повышении достоверности учета населения наметился в начале 90-х годов прошлого столетия, когда в указанной сфере началось активное внедрение информационных технологий. Одним из первых регионов России, приступивших к проектированию и реализации автоматизированных информационных систем (АИС) учета персональных данных различных категорий населения, был город Москва. В настоящее время в Москве эти работы проводятся наиболее масштабно и с наибольшим эффектом по сравнению с другими регионами России.

НЕ нашли? Не то? Что вы ищете?

Однако, создание и внедрение указанных АИС и в Москве, и в других регионах России осуществляется нескоординировано. Персональные данные категорий населения, формируемые по профилю отдельных ведомств, между собой информационно не связаны. Не отработаны вопросы обеспечения необходимой достоверности учета и прогноза изменения параметров населения обслуживаемых территорий. Все это неизбежно приводит к ошибкам при решении задач формирования бюджета соответствующего региона (в частности, города Москвы) и может служить причиной серьезных социально-демографических кризисов (неучитываемая нелегальная миграция, неучитываемое компактное проживание национальных группировок мигрантов, неучитываемая нагрузка на городскую инфраструктуру и т. п.).

Целью исследований, проведенных автором, являлись обоснование и разработка технических решений по созданию информационной сети интегрированной системы учета персональных данных населения (ИСУПДН) административного округа города Москвы, обеспечивающей необходимую достоверность учета наличного населения обслуживаемой территории и поддержание в актуальном состоянии совокупности сведений о качественном составе населения этой территории.

В начале исследований особое внимание было уделено изучению отечественного и зарубежного опыта в области ведения персонального учета населения. Рассмотрены и проанализированы основные виды регистрации данных о населении, реализуемые в настоящее время органами государственной власти и другими организациями федерального подчинения (регистрация в системе пенсионных фондов, регистрация налогоплательщиков, регистрация избирателей и т. п.). Установлено, что указанные выше виды учета персональных данных в своей совокупности потенциально позволяют получить достаточно полную характеристику состава населения территорий Российской Федерации, в частности:

-  половозрастной состав населения территории;

-  уровень доходов субъектов учета населения;

-  отношение субъектов учета к движимому и недвижимому имуществу;

-  квалификационный (профессиональный) состав населения;

-  классификацию населения по состоянию здоровья, видам заболеваний и другим социально значимым медицинским показателям;

-  другие социально значимые показатели субъектов учета населения.

Проведенные исследования еще раз подтвердили тот факт, что собственно сама интеграция персональных данных категорий населения, учитываемых по профилю различных ведомств и территориальных учреждений, в настоящее время отсутствует. Это не позволяет в полной мере использовать информацию, хранимую и обрабатываемую в составе совокупности автоматизированных систем ведомственного учета категорий населения, для эффективного управления социально-экономическим развитием территорий России.

В рамках исследования зарубежного опыта в области персонального учета населения были проанализированы соответствующие системы 22 стран мира с различным уровнем экономического развития, численностью населения, административно-территориальным устройством, в том числе: Швеции, Финляндии, Франции, Ирландии, США, Австрии, Литвы, Эстонии, Венгрии, Болгарии и др. Рассмотрены назначение, функции, архитектура и основные характеристики указанных систем (в том числе: объем и состав обрабатываемой, хранимой и передаваемой информации, организационное и нормативно-правовое обеспечение систем и др.). Установлено, что опыт создания и применения интегрированных систем учета персональных данных населения за рубежом незначителен, и ни одно из существующих решений не может использоваться в качестве прямого прототипа при создании соответствующей системы в России. В связи с этим необходимо было исследовать структуру и состав информационных потоков учета персональных данных населения, обосновать и разработать принципы построения перспективной информационной сети ИСУПДН. В качестве модельной территории для разработки указанной сети был принят Северный административный округ г. Москвы с численностью наличного населения более 1 млн. человек.

Следующий этап исследований был посвящен анализу структуры и достоверности персональных данных населения, используемых в различных информационных системах (ИС) и информационных ресурсах (ИР) города Москвы. С использованием сведений из [2] было рассмотрено более 30 городских автоматизированных информационных систем (АИС), осуществляющих ведение персональных данных тех или иных категорий населения, в том числе:

-  автоматизированная система учета населения (АСУН) г. Москвы и Московской области;

-  многоуровневая автоматизированная информационная система «ЗАГС» города Москвы;

-  автоматизированная система «Территориальный военно-учетный орган»;

-  автоматизированная информационная система жилищных субсидий и возмещения выпадающих доходов от льгот;

-  автоматизированные информационные системы медицинских учреждений различных типов;

-  автоматизированная информационная систем налоговой службы по городу Москве (АИС «Налог 2 Москва»);

-  автоматизированная информационная система учета и идентификации беспризорных и безнадзорных несовершеннолетних;

-  другие АИС.

По результатам проведенного анализа была построена информационная модель полноты охвата наличного населения территории (на примере административного округа города Москвы) при осуществлении персонального учета различными ведомственными информационными системами г. Москвы (рисунок 1). Множество «1» представляет собой все реальное наличное население в пределах территории данного административного округа, множество «2» - это население, зарегистрированное по месту жительства или по месту пребывания на территории округа, множества «3», «4» и «5» и т. д. иллюстрируют население, зарегистрированное различными ведомствами, связанными с учетом тех или иных категорий населения.

Рисунок 1 – Информационная модель полноты охвата населения территории административного округа г. Москвы

На основе анализа структуры персональных данных, формируемых в различных АИС, была разработана и обоснована информационно-лингвистичекая модель сводных персональных данных населения. Данная модель положена в основу концепции интеграции различных видов информации по персональным данным категорий населения и представляет собой разветвленный орграф (рисунок 2). Вершиной «1» являются адресные данные, вершины «2» - идентификационные данные субъектов учета, зарегистрированных по одному адресу; вершины «3» - признаки принадлежности субъекта учета к соответствующим социально-профессиональным группам и категориям населения; вершины «4» - специальные персональные данные по профилю соответствующего ведомства, уполномоченного вести учет социально-профессиональных групп и категорий населения. Полученная модель позволяет интегрировать и согласовать всю совокупность персональных данных по субъектам учета категорий населения, которые ведутся различными специализированными системами персонального учета, и получать сводные персональные данные по каждому субъекту учета наличного населения обслуживаемой территории.

Рисунок 2 – Информационно-лингвистическая модель интегрированных (сводных) персональных данных

В завершении данного этапа исследований был установлен и обоснован ряд концептуальных принципов, которые легли в основу дальнейшей разработки и реализации информационной сети ИСУПДН, в том числе:

-  Использование в качестве базиса информационной сети ИСУПДН модифицированной (с технологической и правовой точки зрения) системы регистрационного учета населения по месту жительства и по месту пребывания для обеспечения полноты охвата наличного населения по адресному признаку.

-  Реализация информационной сети ИСУПДН на основе интеграции эксплуатируемых автономных автоматизированных систем учета различных категорий населения и информационных ресурсов, содержащих персональные данные, создание и сопровождение которых обеспечивается самостоятельно органами власти, без кардинальной модификации этих ресурсов и систем (обеспечение независимости развития автономных составных частей информационной сети ИСУПДН).

-  Использование в рамках информационной сети ИСУПДН единой системы стандартизованных и унифицированных справочников, классификаторов, кодификаторов, в том числе, для снижения уровня инструментальных погрешностей учета населения (категорий населения).

-  Использование персонального идентификационного номера для однозначной идентификации человека в различных системах учета категорий населения и для организации согласованного межсистемного взаимодействия в составе информационной сети ИСУПДН.

-  Использование электронного удостоверения личности как технологического инструмента идентификации человека и средства снижения методических погрешностей учета наличного населения управляемой территории.

-  Использование единой системы стандартизованных и унифицированных протоколов обмена данными при взаимодействии различных АИС в составе информационной сети ИСУПДН для снижения уровня методических погрешностей учета населения (категорий населения).

-  Протоколирование и анализ всех производимых действий и операции с персональной информацией, хранимой, обрабатываемой и передаваемой в информационной сети ИСУПДН, для повышения уровня защиты информации о населении.

-  Реализация единой прозрачной процедуры подключения к информационной сети ИСУПДН вновь создаваемых систем учета категорий населения и абонентских систем.

-  Реализация возможности поэтапного развития перечня сервисов, предоставляемых информационной сетью ИСУПДН абонентам (органам власти, уполномоченным организациям, гражданам и т. п.).

-  Реализация защиты персональных данных в соответствии с действующим законодательством и требованиями к обеспечению информационной безопасности, предъявляемыми к информационной сети ИСУПДН (в том числе – за счет организации обслуживания статистических и аналитических запросов на основе формирования в составе ИСУПДН агрегированных деперсонифицированных сводных данных по субъектам учета населения).

-  Максимальное использование существующих компонентов информационно-технологической инфраструктуры органов власти (для снижения затрат по созданию, использованию и развитию инфраструктуры ИСУПДН).

На третьем этапе исследований был проведен анализ методов прогнозирования параметров населения обслуживаемой территории, основанных, в том числе, на использовании различных математических моделей описания демографических процессов (модели Ферхюльста, Хатчинсона, Вайдлиха и др.) [3, 4, 5, 6 и др.]. Установлено, что в настоящее время отсутствуют адекватные способы оценки достоверности таких прогнозов. В следствие этого автором была разработана и обоснована методика определения реальных погрешностей прогнозных оценок, полученных с помощью известных методов и математических моделей, основанная на использовании сведений о населении из информационной сети ИСУПДН. Применение полученной методики позволяет оценить целесообразность использования указанных выше методов и моделей для прогнозирования того или иного параметра населения данной конкретной территории.

Кроме того, автором был предложен и апробирован на практике оригинальный метод формирования математической модели прогноза численности населения и его отдельных категорий, адаптивно учитывающей реальные демографические процессы, происходящие на заданной территории. Если говорить кратко, то данный метод заключается в формировании аппроксимирующей функции на основе данных, накопленных за период эксплуатации информационной сети ИСУПДН и последующей экстраполяции данной функции на заданный упреждающий интервал времени. Отметим, что чем больше будет срок эксплуатации информационной сети ИСУПДН (срок накопления эталонной информации о населении), тем на более продолжительный период может быть экстраполирована оценка ожидаемого состава населения территории с приемлемой достоверностью. Устойчивость оценки по данному методу обеспечена тем, что демографические процессы имеют большую инерционность, резкие скачки показателей количественного и качественного состава населения на прогнозируемом интервале экстраполяции принципиально невозможны (за исключением глобальных катастроф, которые трудно прогнозировать).

Четвертым этапом исследований стал синтез информационной сети ИСУПДН административного округа города Москвы. Как следует из указанных выше принципов построения данной сети, функционально она должна представлять собой совокупность специализированных информационных систем учета различных категорий населения, интегрированных между собой на основе базисной системы регистрационного учета граждан по месту жительства и по месту пребывания – АСУН Московского региона. В пределах Москвы информационная сеть ИСУПДН имеет четыре иерархических уровня, а в пределах административного округа – три: низовой, районный и окружной.

В процессе проведенных исследований были выявлены и проанализированы структура и основные характеристики информационных потоков учета наличного населения ранее определенной модельной территории (САО г. Москвы), а также различные ограничения, касающиеся физической реализации системы [8]. Результаты этого анализа послужили основой исходных данных для последующей разработки архитектуры системы - концепции, определяющей основные элементы информационной сети ИСУПДН, характер и топологию взаимодействия этих элементов, а также - логическую, функциональную и физическую организацию технических и программных средств указанной сети.

В качестве концептуальной основы для синтеза информационной сети ИСУПДН выбрана и обоснована интеграция корпоративных приложений (Enterprise Application Integration, EAI) на основе сервис-ориентированной архитектуры (Service Oriented Architecture, SOA) [9]. Все функции ИСУПДН на основе SOA определяются как независимые сервисы с вызываемыми интерфейсами. Обращение к этим сервисам в определенной последовательности позволяет реализовать требуемый бизнес-процесс.

Базисом коммуникационной инфраструктуры информационной сети ИСУПДН является корпоративная сервисная шина (Enterprise Services Bus, ESB), которая выполняет следующие основные задачи:

-  трансформация передаваемых сообщений;

стандартизация и упрощение способов подключения сервисов ИСУПДН к магистрали;

-  маршрутизация сообщений;

-  гарантированная доставка сообщений с использованием различных протоколов (SOAP-over-HTTP, MOM/JMS, JMS-over-SSL и др.) и обеспечение безопасности на маршруте.

Взаимодействие приложений в составе информационной сети ИСУПДН с использованием магистрали ESB поясняется на рисунке 3.

Рисунок 3 – Взаимодействие приложений с использованием магистрали ESB

В процессе синтеза информационной сети ИСУПДН разработан перечень всех атомарных и композитных элементов сообщений, которыми должны обмениваться взаимодействующие системы персонального учета категорий населения управляемой территории. Разработана структура типовых сообщений и произведена расчетная оценка их максимальных размеров, позволившая оценить необходимую пропускную способность каналов передачи данных в рассматриваемой системе.

В итоге была разработана топология информационной сети ИСУПДН административного округа города Москвы, фрагмент которой представлен на рисунке 4. Узлу «A» соответствует Центральное адресно-справочное бюро (ЦАСБ) г. Москвы, узлу «В» - структурное звено уровня административного округа, узлам «С» - структурные звенья районного уровня базисной системы учета населения (районные отделения отдела УФМС РФ по городу Москве), узлам «D» - паспортные столы низового уровня базисной системы. Узлам «E» соответствуют системы персонального учета категорий населения, осуществляющие двусторонний информационный обмен со структурными элементами низового, районного или окружного уровня базисной системы информационной сети ИСУПДН. Литерой «F» обозначены абонентские системы соответствующего уровня иерархии. Надписи над стрелками, связывающими структурные звенья различных уровней базисной системы, указывают минимально необходимую пропускную способность соответствующих каналов передачи данных (Кбит/с).

Рисунок 4 – Оптимизированная топология информационной сети базисной системы в составе ИСУПДН административного округа г. Москвы

Таким образом, проведенные исследования позволили обосновать и разработать принципы системного построения информационной сети ИСУПДН в целом (на примере САО г. Москвы), определить требования к ее основным элементам, характеру и топологии взаимодействия этих элементов, синтезировать логическую, функциональную и физическую структуру технических и программных средств указанной сети и т. п. Последующая реализация информационной сети ИСУПДН представляла собой стандартную формализованную инженерную задачу, решаемую при развертывании указанной сети на территории конкретного административного округа г. Москвы.

Результаты исследований получили практическую реализацию в процессе проведения работ по развитию Автоматизированной системы учета населения Северного административного округа Москвы – АСУН САО (территориальной составной части АСУН Московского региона), работ по созданию и развитию Общегородской интегрированной автоматизированной системы ведения единого реестра социальных льготников – ОАИС ЕРСЛ, а также работ по развитию Единой системы классификации и кодирования технико-экономической и социальной информации г. Москвы (ЕСККМ ТЭСИ).

Список использованных источников:

1.  , . Государственный регистр населения. Проблемы и решения. – М., издательство «Нела-Информ», 2004;

2.  База данных Реестра информационных ресурсов и систем г. Москвы (www. *****);

3.  . Демография. Методы анализа и прогнозирования. – М., Издательство «Экзамен», 2005.

4.  . Уравнения с последствием и математическое моделирование. – М., «Соросовский образовательный журнал», № 4, 1996;

5.  . Об одной модели динамики численности населения с учетом формирования и распада семейных пар. – Омск, ОмГУ, «Математические структуры и моделирование», № 6, 2000;

6.  В. Вайдлих. Социодинамика. Системный подход к математическому моделированию в социальных науках. – М., Едиториал УРСС, 2005.

7.  , , . Применение пластиковых карт при автоматизации учета населения РФ. – М., «Предпринимательство. Этика. Техника», № 2 (2003);

8.  . Информационная сеть системы паспортно-визового учета населения САО г. Москвы. – М., Тезисы докладов научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ, 2005;

9.  . Интеграция информационных систем персонального учета населения. – М., Тезисы докладов научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ, 2006.