Организация Объединенных Наций

ECE/CES/2012/20

Экономический
и Социальный Совет

Distr.:

27 March 2012

Russian

Original:

Европейская экономическая комиссия

Конференция европейских статистиков

Шестидесятая пленарная сессия

Париж, 6−8 июня 2012 года

Пункт 3 а) предварительной повестки дня

Цикл переписей 2010 года − нововведения
и извлеченные уроки

Проблемы перехода от традиционной к регистровой переписи в Австрии

Записка Статистического управления Австрии

Резюме

В настоящем документе отражены основные моменты перехода от традиционной к регистровой переписи в Австрии. Кроме того, в нем обсуждается структурный метод оценки качества административных данных. Данный метод, основывающийся на трех этапах (исходные данные, сводные данные, условно рассчитанные данные), позволяет получать показатели качества, которые должны охватывать всю имеющуюся информацию о качестве каждого атрибута. В интересах обеспечения применимости рамочной системы качества для регистровой переписи 2011 года данная процедура была опробована путем использования данных, полученных с помощью основывающихся на регистрах статистических данных о рынке труда 2009 года.

Преимущество данного метода заключается в том, что оценка качества и обработка данных являются независимыми. Это предоставляет возможность применять данные методы в отношении других наборов данных, основывающихся на регистрах. Кроме того, активизируется сотрудничество между национальной статистической организацией и регистрационными органами, поскольку субъект, располагающий данными, включается в процесс оценки качества.

I. Переход от традиционной к регистровой переписи
в Австрии

НЕ нашли? Не то? Что вы ищете?

1. В мае 2001 года в Австрии была проведена последняя традиционная перепись населения, которая сопровождалась переписью жилищно-строительного фонда, а также переписью местных единиц занятости. В ходе этой комбинированной переписи было охвачено около 2 млн. зданий, 3,8 млн. жилых единиц и 3,3 млн. домашних хозяйств, объединяющих 8,1 млн. человек, на основе использования бумажных опросных листов. Таким образом, традиционная перепись является весьма сложным процессом и связана с большими затратами.

2. С учетом того, что к традиционным переписям предъявляются высокие требования, в последнее время возрастает важность административных источников данных для статистических целей. Обработка данных, которые уже зарегистрированы административными органами, предлагает многочисленные преимущества в сравнении с данными обследований, такие как сокращение затрат, устранение нагрузки на респондентов и оперативное представление данных. Использование данных, содержащихся в существующих регистрах, должно обеспечить оптимальное отражение реальной обстановки при разумных расходах путем комбинирования регистров за счет использования единых увязывающих переменных, повышения качества данных и согласования определений. Еще одно очевидное преимущество иллюстрируется регулярным обновлением регистровой информации с целью отслеживания любых изменений в данных, описывающих статистические единицы и их атрибуты (Statistics Finland, 2004, p. 10).

3. В этой связи все большее число национальных статистических управлений (НСУ) поощряют использование регистровых переписей вместо дорогостоящих традиционных переписей. В 2000 году Совет министров Австрии решил внедрить новый метод проведения переписи 2011 года, и в 2006 году судебные органы привели в действие нормативную рамочную основу. Австрия входит в число шести европейских стран (помимо Швеции, Финляндии, Норвегии, Дании и Словении), которые в 2011 году провели перепись, основывающуюся на регистрах.

4. На основе численности населения, охваченного этой переписью, была определена денежная сумма налогового выравниваниям между муниципалитетами и федеральными финансовыми органами, а также число лиц, которые имеют право участвовать в предстоящих выборах. Кроме того, информация о лицах, совершающих ежедневные маятниковые поездки, образовании и занятости содержит важные данные для экономической и социальной политики. Однако административные данные могут опираться на определения, которые не соответствуют потребностям НСУ даже в том случае, если эти данные характеризуются высоким качеством (см. Организация Объединенных Наций, 2007 год, стр. 3). Поэтому НСУ должны принимать решения о том, пригодны ли эти данные для конкретного вопроса, представляющего интерес.

A. Принцип избыточности

5. Основная проблема возникает при выборе надлежащих источников данных для представления требуемой информации. Перепись на основе регистров направлена на охват всех соответствующих переменных, которые ранее предоставлялись с помощью традиционной переписи. В этом отношении перепись 2001 года дала первоначальный толчок к созданию ряда источников данных, таких как центральный регистр населения (ЦРН), жилищный регистр зданий и жилых единиц (ЖР) или регистр образовательного уровня (РОУ). До 2001 года в Австрии не существовало взаимосвязанной системы архивных данных о населении. Каждый муниципалитет имел свои собственные архивы и, как правило, данные даже не вносились в электронные системы. После того как в 2001 году был создан жилищный регистр, централизованный регистр населения претерпел изменения, и муниципалитеты начали в обязательном порядке представлять свои архивные записи. Последняя проводившаяся в Австрии традиционная перепись основывалась на информации, содержащейся в этом недавно созданном регистре населения. В 2004 году впервые жилищный регистр зданий и жилых единиц был синхронизирован с регистром населения. Кроме того, в ходе переписи 2001 года был основан регистр образовательного уровня.

6. На рис. 1 иллюстрируются все базовые регистры переписи и их связи с соответствующими тематическими вопросами. Заштрихованные красным цветом источники данных ведутся Статистическим управлением Австрии, а другая информация предоставляется внешними субъектами, располагающими соответствующими данными, такими как Государственная служба трудоустройства Австрии (ГСТ) или Управление социального страхования Австрии (УСС). Центральный регистр населения (ЦРН) формирует основу переписи, поскольку статистическими единицами анализа являются лица, имеющие основное жилище в Австрии. В интересах обеспечения качества результатов переписи базовые регистры подкрепляются семью сравнительными регистрами. Данные по этим семи категориям административных единиц представляются 35 организациями, располагающими данными, и в основном используются для перекрестных проверок, а также для представления информации, которая отсутствует или которая только частично содержится в базовых регистрах (Berka et al., 2010, p. 300).

7. С учетом независимости различных регистров, а также автономного процесса сбора данных их источники иногда отражают противоречивые значения для одной и той же переменной. Поэтому используется принцип избыточности для обеспечения достаточного качества данных путем использования информации о поле, национальности или возрасте, извлекаемой из максимально возможного числа регистров. Особый метод, разработанный Статистическим управлением Австрии, имеет своей целью определить один конкретный базовый регистр для представления информации в отношении некоторой переменной, в то время как сравнительные регистры используются для подтверждения ее значения в базовых регистрах (Lenk, 2008, p. 3). Хотя регистры содержат достаточную информацию для большинства характеристик традиционной переписи, некоторые переменные могут не включаться в перепись на основе регистров. Например, информация о продолжительности ежедневной маятниковой поездки, разговорном языке или религии не включается в какой-либо из существующих регистров.

В. Защита конфиденциальности данных

8. Поскольку фамилии и номера социального страхования физических лиц не относятся к процессу представления данных, для объединения информации, поступающей от различных субъектов, располагающих данными, требуется единый идентификационный номер. В интересах обеспечения конфиденциальности данных до их направления в Статистическое управление Австрии требуется ввести конкретный отраслевой личный идентификационный номер для официальной статистики (bPIN OS). В Австрии каждая административная отрасль, например "социальное страхование", "налоги" или "социальное обеспечение", имеет свой собственный bPIN. Эти 172-значные PIN, которые должны служить для защиты конфиденциальности информации, которой государственные органы обмениваются по каналам системы электронного управления, извлекаются Комиссией по защите данных Австрии (КЗД) из регистра SourcePIN (Stammzahlregister).

9. На рис. 2 иллюстрируется защита конфиденциальности данных посредством извлечения конкретного отраслевого PIN, а также PIN для официальной статистики. Субъекты, располагающие данными, запрашивают у КЗД эти PIN по каждому лицу путем направления его фамилии и информации о его поле, дате рождения, месте рождения и адресе. Конкретные отраслевые PIN (bPIN),
а также PIN для официальной статистики (bPIN OS) извлекаются из регистра SourcePIN с помощью специального и весьма сложного алгоритма, разработанного КЗД. bPIN OS для всех других владельцев регистров, за исключением Статистического управления Австрии, предоставляются только в зашифрованной форме. Субъекты, располагающие данными, должны направлять соответствующие данные вместе с зашифрованным bPIN OS в Статистическое управление Австрии. Кроме того, владельцы регистров направляют свой собственный зашифрованный отраслевой PIN по каждому лицу с целью определения соответствующей записи в том случае, если Статистическое управление Австрии обращается с последующими запросами (Lenk, 2008, p. 5).

10. Каждый субъект, располагающий данными, может представить свой собственный bPIN в форме 28-значного номера, в связи с чем только НСУ имеет возможность расшифровать bPIN OS и использовать его в качестве общей связующей переменной для ввода регистровых данных. Описанная выше процедура шифрования личного идентификационного номера впервые применялась
в ходе проведения пробной переписи в 2006 году.

Рис. 1
Регистры и тематические вопросы в австрийской переписи, основывающейся на регистрах

Жилищный регистр
зданий и жилых
единиц

 
Подпись:

Регистр
населения

 
 

 

Перепись местных
подразделений
предприятий

 

Перепись зданий
и жилых единиц

 
 

Регистр
безработных (РБ)

 

Центральный регистр
социального
страхования (ЦРСС)

 
Рис. 2
Защита конфиденциальности данных в переписи, основывающейся на регистрах

bPIN ЦРСС +

 

Статистическое
управление
Австрии

 

Статистическое
управление
Австрии

 

Комиссия
по защите данных

 

Комиссия
по защите данных

 

bPIN РБ +

 

bPIN OS + Атрибуты

 

bPIN OS + Атрибуты

 

bPIN ЦРСС

 

Фамилия, дата рождения, пол

 

Фамилия, дата рождения, пол

 

bPIN OS

 

bPIN OS

 

ЦРСС

 

РБ

 

bPIN OS

 

bPIN РБ

 

bPIN OS

 

Регистр SourcePIN

 

Регистр SourcePIN

 

II. Проведение предварительных переписей

А. Пробная перепись 2006 года

11. В 2006 году Статистическое управление Австрии провело пробную перепись в масштабах полной переписи населения, домов и жилых единиц, а также местных единиц занятости с целью оценки трудностей перехода от традиционной к регистровой переписи. Впервые от различных организаций, располагающих соответствующими данными, была запрошена информация для целей комбинированной административной статистики. Несмотря на ряд незначительных проблем с источниками данных, пробная перепись принесла в целом весьма успешные результаты. В частности, данные по демографическим вопросам, образованию и занятости характеризировались отличным качеством и достоверностью, хотя и возникали некоторые проблемы в связи с определением места работы лиц, совершающих ежедневные маятниковые поездки, и увязкой физических лиц с местом их проживания (Statistics Austria, 2009, p. 7). Статистическое управление Австрии подтвердило качество полученных результатов путем
их сопоставления с выборочным обследованием для одной и той же базовой даты (Lenk, 2008, p. 14).

12. В 2008 году осуществление закона о налоговом выравнивании стало поистине поворотной точкой в истории проведения австрийских переписей. Данный закон увязал передачу федеральных фондов к муниципалитетам с численностью населения, определенной на основе пробной переписи, которая вначале выступала в качестве проверочного обследования, а затем превратилась в политически важный инструмент.

В. Анализ места жительства

13. В интересах обеспечения качества проведения более широкой пробной переписи необходимо обнаружить отсутствующие величины, краткие записи или ошибки измерений и устранить их для целей расчетов. Эта процедура,
известная под названием "анализ места жительства", предусматривает исключение физических лиц из переписи по следующим пяти причинам:

a) конкретное лицо умерло до наступления базовой даты, но по-прежнему значится в ЦРН;

b) физическое лицо многократно указывается в регистрах в базовый день, например по двум или более основным адресам в ЦРН;

c) конкретное лицо зарегистрировано на протяжении менее 90 дней по основному адресу в Австрии, что увязывает численность населения с минимальным пребыванием;

d) установление случаев так называемого "переписного туризма", т. е. лиц, которые зарегистрированы в том или ином муниципалитете на протяжении не более чем 180 дней, а в другом − до и после базового периода;

e) наличие случаев возможных несоответствий без ссылки на основной адрес, т. е. наличие лиц, которые зарегистрированы только в ЦРН, но не значатся в каких-либо других административных источниках.

14. Последний случай требует разъяснений со стороны НСУ, поскольку "признаки жизни" не являются удовлетворительными (см. таблицу 1). Совершенно ясно, что в отношении физических лиц, которые включены только в ЦРН, требуются разъяснения и они запрашиваются в письменной форме[1] − так обстоит дело с лицом, имеющим ID3459, в данном примере. В рамках пробной переписи такие письма были направлены околочеловек, из которых 9 000 человек подтвердили, что они имеют основное место жительства в Австрии. И наконец, в переписи не было учтено около 0,5% первоначальной численности населения, включая приблизительночеловек, которые были исключены по техническим причинам (см. пункты 1−3). Австрийские органы власти должны информироваться о таких лицах, в связи с чем регистрационные органы имеют возможность удостовериться в том, действительно ли проживают в указанных местах эти лица, и, возможно, исключить их из адресного регистра. По итогам пробной переписи, проведенной в 2006 году, около 80% лиц, исключенных из переписи, были выведены из адресных регистров местными органами власти.

15. Для регистровой переписи 2011 года Статистическое управление Австрии применяет такую же процедуру, как и в ходе пробной переписи 2006 года. В январе 2012 года началось осуществление анализа места жительства. В ходе первого цикла было направлено околописем с целью определения основного места жительства соответствующих лиц. Второй цикл планируется провести в сентябре 2012 года, поскольку к этой дате будет завершена передача данных от внешних организаций, располагающих соответствующими данными.

Таблица 1
"Признаки жизни" в анализе места жительства

____________________________________________________

bPIN OS ЦРН ЦРСС НР РБ РСО РПР...

ЦРН = Центральный регистр населения, ЦРСС = Центральный регистр социального страхования, НР = Налоговый регистр, РБ = Регистр безработных, РСО = Регистр лиц, получающих пособия по социальному обеспечению, РПР = Регистр пособий на ребенка

C. Основывающиеся на регистрах статистические данные
о рынке труда

16. Особенно широкие возможности для статистики в реальном масштабе времени обеспечиваются в результате ежегодного представления основывающихся на регистрах статистических данных о рынке труда. Начиная с 2009 года данные о демографии, образовании, лицах, совершающих ежедневные маятниковые поездки, и рынках труда предоставляются на ежегодной основе и позволяют получать подробную информацию по существующим в Австрии экономическим и социальным вопросам даже на уровне отдельных муниципалитетов. Например, достаточно часто поступающие административные данные позволяют осуществлять углубленный анализ изменений в уровнях безработицы среди молодежи в период между двумя конкретными годами или определять гендерные различия в образовательном уровне. Используемые источники данных, а также процедуры, применяемые для подготовки этих атрибутов, являются одними и теми же для методов, предназначенных для регистровой переписи. Была обеспечена увязка около 35 различных источников административных и статистических данных с целью получения представляющих интерес переменных. На основе использования основывающихся на регистрах статистических данных о рынке труда НСУ обеспечивает соответствие стандартам современной статистики и анализа данных. Эти данные даже открыты для свободного доступа в статистической базе данных на домашней странице НСУ (www. statistik. at).

III. Рассмотрение рамок для оценки качества

17. Переход от традиционной к регистровой переписи в Австрии в течение короткого периода времени являлся крайне трудной задачей. Переходный период, в течение которого данные обследования были постепенно заменены административными данными, занял около 20 лет в некоторых европейских странах (см. Ruotsalainen (2008) в отношении Финляндии). Он предоставил НСУ, а также организациям, располагавшим соответствующими данными, возможности для активного обсуждения вопросов о качестве оценки в некоторых странах, в то время как график перехода был весьма амбициозным в Австрии. Поскольку НСУ не отвечает за ведение внешних данных, следует особо подчеркнуть необходимость оценки качества в процессе осуществления основывающихся на регистрах переписей. Анализ качества регистровых данных должен удовлетворять ряду таких требований, как транспарентность, точность и обоснованность. Наш подход содействует созданию рамок качества для анализа административных данных с помощью трех различных гиперизмерений для получения индексов качества (см. Berka et al., 2012). Эти рамки тесно связаны с потоком данных, который, однако, не зависит от обработки данных: это означает, что обработка данных не подвергается какому-либо влиянию, а всего лишь оценивается.

18. Поток данных австрийской регистровой переписи состоит из трех уровней: исходные данные (т. е. регистры), набор сводных данных (база данных переписи, далее − БДП) и набор условно рассчитанных данных (окончательный пул данных, ОПД). На рис. 3 иллюстрируется процесс обработки данных, начиная с получения исходных данных от различных организаций, располагающих административными данными. Информация связывается через уникальный ключ (Bpin OS) и объединяется в массивы данных в БДП. Данные БДП далее пополняются с помощью условно рассчитанных данных по позициям, по которым не было получено ответов, и образуют ОПД, содержащий реальную информацию и информацию, полученную на основе оценочного анализа.

Рис. 3
Рамки качества для переписей на основе регистров

А. Оценка качества на уровне регистров

19. Информация о качестве на исходном уровне поступает через три гиперизмерения: документация (HDD), предварительная обработка (HDP) и внешний источник (HDE). До рассмотрения данных HDD обеспечивает описание касающихся качества процессов в регистрационном органе, а также документирования данных (т. е. метаданные). Степень надежности и достоверности информации, поступающей от организаций, располагающих соответствующими данными, контролируется с помощью вопросника, содержащего 16 открытых и 9 рейтинговых вопросов (например, административная цель или обработка данных). Поэтому НСУ имеет возможность проводить проверки методов сбора данных или правовой приемлемости записи данных, что может в значительной степени влиять на качество данных. Ответы на вопросник направляются экспертами соответствующих организаций, располагающих данными, и в этой связи он должен приносить убедительные результаты.

20. Второе гиперизмерение HDP относится к формальным ошибкам в исходных данных. На этом этапе создания рамок качества осуществляется обнаружение ошибок в диапазоне изменения данных, неполученных ответов по отдельным позициям и отсутствующих первичных ключей. С помощью этого гиперизмерения в конечном итоге удается получить отношение используемых записей к общему числу записей. Как и ранее, эта процедура осуществляется для каждого атрибута в каждом регистре. Если доля используемых записей для каждого атрибута в том или ином регистре является меньшей, нежели доля этого же атрибута в другом регистре, то показатель качества будет, соответственно, ниже.

21. И наконец, третье гиперизмерение HDE обеспечивает сопоставление между основывающимися на регистрах данными и внешним источником. Проводящаяся в Австрии микроперепись служит своего рода общим контрольным критерием для репрезентативных (от фр. обследований и, как предполагается, является наилучшим имеющимся сравнительным набором данных. Проверка на предмет соответствия внешнему источнику позволяет получать третий показатель качества, который представляет собой отношение между числом совпадающих значений и общим числом увязанных записей. Если представляющий интерес атрибут не охватывается данным критерием, мы опираемся на мнение местных экспертов.

22. С учетом этих трех показателей качества общий показатель качества для каждого атрибута и регистра может быть рассчитан в виде взвешенного среднего. Таким образом, этот показатель способен учитывать оказываемое на качество воздействие, начиная с процесса генерации данных и заканчивая включением в регистры окончательных исходных данных.

В. Оценка качества в базе данных переписи

23. Вся информация из регистров объединяется в рамках БДП, которая охватывает все атрибуты, представляющие интерес для переписи. Поскольку могут существовать несколько источников данных, предоставляющих определенный атрибут, набор правил, заранее определенный НСУ, позволяет выбирать наиболее приемлемую информацию из основополагающих регистров. Что касается оценки качества БДП, то мы проводим различия между тремя видами атрибутов на основе их происхождения:

а) уникальные атрибуты существуют только в одном регистре, например такие, как образовательный уровень (ср. атрибут С на рис. 3);

b) кратные атрибуты содержатся в нескольких регистрах, например такой атрибут, как пол (ср. атрибут А на рис. 3). Информация, поступающая из широкого круга источников, объединяется с помощью набора правил с целью получения наиболее приемлемого значения в атрибуте БДП;

c) производные атрибуты подготавливаются на основе различных атрибутов, например такие, как статус занятости (ср. атрибуты F и G на рис. 3). Регистры не содержат какой-либо информации для этих атрибутах в требуемой спецификации.

24. Подробное описание оценки качества для трех видов атрибутов в БДП содержится в статьях Berka et al. (2010) и Berka et al. (2012).

25. Проводящиеся в настоящее время исследования посвящены главным образом окончательному пулу данных (ОПД), который соответствует базе данных переписи после проведения условных расчетов. Проведение условных расчетов фактически сокращает долю отсутствия ответов по отдельным позициям, однако сам процесс условных расчетов должен контролироваться. Это текущая задача решается путем использования информации, получаемой с помощью гиперизмерения "Условный расчет" (HDI).

С. Выводы и перспективы

26. В настоящем документе отражены основные моменты перехода от традиционной к регистровой переписи в Австрии. Кроме того, в нем обсуждается структурный метод оценки качества административных данных. Данный метод, основывающийся на трех этапах (исходные данные, сводные данные, условно рассчитанные данные), позволяет получать показатели качества для трех ги-перизмерений. Эти показатели должны охватывать всю имеющуюся информацию о качестве каждого атрибута. В интересах обеспечения применимости рамочной системы качества для регистровой переписи 2011 года данная процедура была опробована путем использования данных, полученных с помощью основывающихся на регистрах статистических данных о рынке труда 2009 года.

27. Несомненные преимущества имеющейся рамочной системы качества заключаются в том, что оценка качества и обработка данных являются независимыми. Изолирование этого процесса от процедуры обработки данных необходимо для его оценки без оказания какого-либо воздействия на него. Это предоставляет возможность применять соответствующие методы в отношении других наборов данных, основывающихся на регистрах. Кроме того, активизируется сотрудничество между НСУ и регистрационными органами, поскольку организация, располагающая данными, включается в процесс оценки качества.

IV. Библиографические ссылки

Berka, C., Humer, S., Lenk, M., Moser, M., Rechta, H., & Schwerer, E. (2010). A quality framework for statistics based on administrative data sources using the example of the Austrian census 2011. Austrian Journal of Statistics, Volume 39, Number 4, 299-308.

Berka, C., Humer, S., Lenk, M., Moser, M., Rechta, H., & Schwerer, E. (2012). Combination of evidence from multiple administrative data sources: quality assessment of the Austrian register-based census 2011. Statistica Neerlandica, Volume 66, Issue 1, 18-33.

Lenk, M. (2008). Methods of Register-based Census in Austria (Tech. Rep.). Statistik Austria, Wien.

Ruotsalainen, K. (2008). Finnish Register-based Census System (Tech. Rep.). Statistics Finland.

Statistics Austria. (2009). Bericht ¨uber die Probez¨ahlung 2006 - Ergebnisse und Evaluierung (Tech. Rep.). Statistics Austria.

Statistics Finland. (2004). Use of registers and administrative data sources for statistical purposes (Tech. Rep.). Statistics Finland.

Организация Объединенных Наций (2007 год). Статистика на основе регистров в Североевропейских странах. Европейская экономическая комиссия Организации Объединенных Наций, Нью-Йорк и Женева.

[1] Письмо, направленное всем лицам, в отношении которых требовались разъяснения, содержит единственный вопрос: "Имели ли вы основной адрес в Австрии в базовый день? − Да или Нет".