Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Утверждена

приказом Председателя

Комитета по статистике

Министерства национальной экономики

Республики Казахстан

от «14» декабря 2015 года

№ 000

Методика построения выборки домашних хозяйств

по обследованию уровня жизни

1.  Общие положения

1.  Методика построения выборки домашних хозяйств по обследованию уровня жизни (далее – Методика) разработана на основе рекомендаций экспертов Всемирного банка в рамках реализации Проекта совместных экономических исследований на 2010 год «Разработка новой выборки для обследования домашних хозяйств по оценке уровня жизни».

2.  Настоящая Методика предназначена для использования структурными подразделениями Комитета по статистике Министерства национальной экономики Республики Казахстана при формировании выборки домашних хозяйств по обследованию уровня жизни.

3.  Целью настоящей Методики является построение выборки для выборочного обследования домашних хозяйств по оценке уровня жизни (далее – Обследование), включая описание этапов формирования, стратификации и расчета выборочных весов.

4.  Настоящая Методика соответствует принятым в мировой практике методам построения выборки и обеспечивает получение качественных статистических данных.

5.  Обследование по своему характеру является многоцелевым. Его основными задачами являются получение широкого спектра данных об уровне жизни населения, весовых показателей для расчета индекса потребительских цен и данных для составления счетов сектора домашних хозяйств в системе национальных счетов.

НЕ нашли? Не то? Что вы ищете?

6.  В настоящей Методике используются следующие понятия и сокращения:

1)  домашнее хозяйство – экономический субъект, состоящий из одного или более физических лиц, проживающих совместно, объединяющих полностью или частично свои доходы и имущество, и совместно потребляющие товары и услуги;

2)  интервьюер – лицо, уполномоченное на проведение опроса;

3)  стандартная ошибка выборки (СО) – стандартное отклонение значения параметра выборки от выборочного среднего значения этого параметра;

4)  относительная стандартная ошибка (ОСО) – отношение оцениваемой статистической величины к его среднему значению.

2. Определение исследуемой совокупности (рамки выборки)

7.  Основным источником для формирования выборочной совокупности домашних хозяйств является информационная система «Статистический регистр жилищного фонда», компонент интегрированной информационной системы «е-Статистика» (далее – CРЖФ).

8.  Использование указанной базы данных обусловлено рядом преимуществ, к которым относятся следующие:

наличие готовой рамки выборки, что исключает одну из существенных статей затрат, связанных с составлением основы выборки;

наличие постоянно актуализируемой базы данных, что необходимо для осуществления ротации домашних хозяйств;

наличие информации о домашних хозяйствах в территориальном разрезе.

9.  В генеральную совокупность включаются домашние хозяйства, проживающие во всех типах жилых помещений, за исключением проживающих в общих коммунальных квартирах, общежитиях, домах-интернатах для престарелых и инвалидов, детских домах, тюрьмах, гостиницах, религиозных общинах и других аналогичных жилых помещениях.

10.  Конечной единицей отбора определено домашнее хозяйство, являющееся также и единицей обследования.

3. Размер выборочной совокупности

11.  Размер выборки определяется на основе принципа оптимального сочетания затрат и заданных критериев точности результатов.

12.  В качестве показателей точности статистического оценивания, используются стандартная ошибка выборки и стандартная относительная ошибка выборки.

13.  СО определяется по следующей формуле:

(1)

где,

SE – стандартная ошибка выборки;

δ – дисперсия;

Deff – влияние дизайна выборки (для города и села составляют 1.0 и 2.0 соответственно);

n – размер выборки.

14.  ОСО определяется по следующей формуле:

(2)

где,

RSE – относительная стандартная ошибка выборки;

SE – стандартная ошибка выборки;

– среднее значение переменной, использованной для оценки величины относительной стандартной ошибки.

Влияние дизайна выборки (Deff) для города и села составляют 1.0 и 2.0 соответственно. Исходя из этого предположения рассчитываются ОСО. Предположение Deff = 1.0 для городской местности объясняется тем, что городские кластеры обследования приближены к случайной выборке, поскольку крупные города не подразделяются на более мелкие территориальные единицы. Предположение Deff = 2.0 в сельской местности основано исключительно на опыте других стран.

15.  Размер выборки обеспечивает получение результатов с ошибкой не более 4% на республиканском уровне и не более 7% на региональном уровне, согласно таблице 1, приведенной в приложении к настоящей Методике. Таким образом, размер выборки устанавливается в 12 000 домашних хозяйств (0,3% от генеральной совокупности).

4. Алгоритм формирования выборочной совокупности

16.  Выборочная совокупность домашних хозяйств формируется методом двухступенчатой вероятностной (случайной) выборки с использованием процедур стратификации и случайного отбора на каждой из ступеней формирования выборки. Процедура стратификации нацелена на формирование представительной выборочной совокупности домашних хозяйств, адекватно отражающей территориальные особенности расслоения населения.

17.  Процесс формирования выборки проводится в 2 этапа.

На первом этапе генеральная совокупность стратифицируется по территориальному признаку, включая распределение на городскую и сельскую местность. Таким образом, формируется 30 страт - это отобранные городские и сельские территории в шестнадцати регионах страны (всего 30 страт с учетом, что в городах Астана и Алматы нет сельской местности).

18.  В качестве первичных выборочных единиц (далее – ПВЕ) отбираются 400 территориальных единиц, которые представляют собой городскую и сельскую местности и определяются первыми шестью (6) знаками кода по Классификатору административно-территориальных объектов (далее – КАТО).

19.  Объем работы каждого из интервьюера составляет 30 домохозяйств в течение одного квартала. Каждая группа из 30 домохозяйств называется кластер и соответствует объему работы одного интервьюера в течение одного квартала.

20.  Первый этап формирования выборки включает в себя две последовательные процедуры. Первоначальная процедура предусматривает определение ПВЕ внутри каждой страты с вероятностью пропорциональной размеру (далее – ВПР), то есть количество ПВЕ в страте формируется в зависимости от числа домохозяйств, присутствующих в страте.

21.  Вероятность отбора (Phi) в выборе первичных выборочных единиц (hi) в страте (h) определяется по следующей формуле:

(3)

где,

Phi – вероятность отбора;

sh – число ПВЕ, выбранных в страте h;

nhi – число домохозяйств в ПВЕ hi, по данным СРЖФ;

Nh – общее число домохозяйств в страте, по данным СРЖФ.

22.  Следующая процедура нацелена на достижение оптимального значения относительной стандартной ошибки по каждой из 30 страт (400 ПВЕ).

23.  Для оценки величины относительной стандартной ошибки, в качестве переменной используются показатели, которые считаются наиболее важными для обследования. По обследованию уровня жизни к таким показателям относят «среднедушевой доход, использованный на потребление», «среднедушевой денежный доход», «среднедушевой денежный расход» и др.

24.  Характеристика оценки точности показателя «среднедушевой доход, использованный на потребление», приведена в таблице 2, согласно приложению к настоящей Методике. Согласно проведенным расчетам величина ОСО выборки по стране не превышает 0,3%, по регионам – не более 2,2%.

25.  Количество отобранных ПВЕ и число домохозяйств в каждой ПВЕ, а также их распределение по регионам приведены в таблице 3, согласно приложению к настоящей Методике.

26.  При проведении фактического отбора ПВЕ в городах необходимо учесть, что в СРЖФ отсутствует деление крупных городов на мелкие территориальные единицы. Например: город Кокшетау с населением более 100 тысяч человек представлен в СРЖФ одной строкой, без дальнейшей дезагрегации. Учитывая относительно крупный размер таких ПВЕ, многие из них выбираются более одного раза в результате стандартной процедуры ВПР.

27.  Первые и последние строки перечня отобранных первичных выборочных единиц представлены в таблице 4 согласно приложению к настоящей Методике. В графе «Отобранные» отмечены ПВЕ, в которых стандартная процедура ВПР проводилась более одного раза. Первая строка показывает, что город Кокшетау действительно был выбран 5 раз. Таким образом, в городе Кокшетау необходимо отобрать 5 кластеров (150 домохозяйств).

28.  На втором этапе формирования выборки, в каждой ПВЕ случайным отбором выбираются 30 домохозяйств. Основой формирования выборки на втором этапе является перечень отдельных жилых помещений в ПВЕ. Кластер (или кластеры) жилищ, которые нужно посетить в ходе обследования, выбирается с равной вероятностью из числа подходящих жилых помещений в ПВЕ.

29.  Вероятность (phij) выбора домохозяйства (hij) в ПВЕ (hi) страты (h) определяется по следующей формуле:

(4)

где,

phi – вероятность выбора ПВЕ hi – заданная уравнением (1);

mhi – число необходимых жилищ в ПВЕ hi (нормативно всегда 30);

n’hi – общее число подходящих жилищ в ПВЕ.

30.  В принципе, ожидается, что каждое отобранное жилище вмещает одно домохозяйство. Если обнаружилось, что в данном жилище находится более одного домохозяйства, то случайным методом выбирается одно из них. Если жилище оказалось пустым, то необходимо применить метод, о котором сказано далее в разделе «Смещение выборки».

31.  Для проверки эффективности работы интервьюеров в городской местности рекомендуется применять метод взаимопроникающей выборки.

32.  В крупных городах, где необходимо иметь число кластеров k (при k > 1), сначала путем систематической равновероятностной выборки (далее – СРВВ) будет выбрано 40k число жилищ, а затем случайная перестановка цифр от 1 до k будет повторена 40 раз, чтобы разделить (город) на число кластеров k – по одному на каждого из k числа интервьюеров в городе.

33.  В городах домашние хозяйства в каждом кластере не будут находиться на определенной территории, что дает возможность проверки качества работы интервьюеров (например: можно проверить количество отказов от обследования в одном и том же районе города у разных интервьюеров).

5. Сегментация выборки

34.  Для практического применения выборки важным фактором является территориальная расположенность отобранных единиц обследования друг от друга внутри одного кластера, так как отдаленность их друг от друга создает дополнительные затраты и неудобства при проведении обследования. Некоторые из отобранных ПВЕ оказываются слишком крупными по численности населения и единицы обследования в них находятся слишком территориально разбросанными друг от друга.

Например: в сельской местности Южно-Казахстанской области одна из ПВЕ (КАТО – 515437) состоит из 14 населенных пунктов с общим числом домохозяйств равным 3183 и отдаленность между ними достигает порядка
25 км.

35.  При возникновении подобных случаев существует возможность корректировки выборки посредством процесса сегментации (дробления или разукрупнения).

36.  Сначала в ПВЕ путем СРВВ выбираются три населенных пункта с учетом числа заселенных в них домохозяйств по СРЖФ и затем в каждом из трех населенных пунктов, также путем СРВВ, отбираются 10 домохозяйств. 10 резервных домохозяйств (для замены) распределяются среди трех отобранных населенных пунктов.

37.  Эта процедура является дополнительным этапом выборки и позволяет получить более кластерную выборку, вместе с тем она не приведет к изменению вероятностей отбора или к изменению весов отобранных домохозяйств. Следовательно, формулы (4) и (5) применяются без изменений в разукрупненных (сегментированных) ПВЕ.

6. Смещение выборки

38.  В ходе обследования имеют место случаи, когда не удается опросить домохозяйства по причине того, что жилище не найдено, или не заселено, или домохозяйство отказывается участвовать в обследовании. Отказ от участия является нежелательным явлением, поскольку сокращает размер выборки и в основном потому, что является источником потенциального смещения выборки и ведёт к искаженным статистическим результатам.

39.  Эффективной профилактикой преодоления проблемы неполучения данных является тщательное документирование каждого случая.

40.  При возникновении сложности по соблюдению принципа «недопущения замены» следует предусмотреть список резервных домашних хозяйств в размере 1/3 количества домашних хозяйств в каждом кластере (по 10 домохозяйств на интервьюера).

41.  В общей сложности в каждом кластере отбираются 40 жилищ: 30 в номинальной выборке и 10 заменяющих. Эти 40 жилищ отбираются из числа всех подходящих жилищ в ПВЕ путем СРВВ, а затем случайно выбранная циклическая перестановка цифр 0, 1, 2 и 3 повторяется десять (10) раз, чтобы разделить кластер на четыре группы из 10 жилищ. Жилища в группах 1, 2 и 3 составят номинальную выборку, а жилища в группе 0 будут держаться в резерве для возможной замены.

42.  Отбор резервных домашних хозяйств из дополнительного списка осуществляется по принципу снизу вверх. То есть, из 10 домашних хозяйств для замены последовательно отбираются домашние хозяйства: с начала – десятое по счету (последнее в списке), затем – девятое по счету и так далее.

7. Взвешивание

43.  В целях получения распространенных на генеральную совокупность данных, производится статистическое взвешивание итогов обследования. Реализация данного метода осуществляется посредством присвоения каждому обследованному домашнему хозяйству статистического веса, который характеризует общее число домашних хозяйств, представляемых частью, попавшей в выборку. Веса для показателей уровня жизни населения рассчитываются ежеквартально.

44.  Для расчета весов используется данные СРЖФ о распределении обследуемых домашних хозяйств отдельно по городскому и сельскому населению в региональном разрезе.

45.  Вес вероятности (whij) домохозяйства в ПВЕ (hi) страты hi (h) представляет собой обратное значение его вероятности отбора phij и определяется по следующей формуле:

(5)

где,

Whij – вес домохозяйства;

Phij – обратное значение вероятности отбора;

Nh – общее число домохозяйств в страте, по данным СРЖФ;

n’hi – общее число подходящих жилищ в ПВЕ;

Sh – число ПВЕ, выбранных в страте h;

mhi – число необходимых жилищ в ПВЕ hi (нормативно всегда 30).

Поскольку n’hi ≈ n’hi и mhi ≈ 30 во всех ПВЕ, выборка будет примерно самовзвешенной в пределах каждой страты.

46.  Сумма «базовых» весов обеспечивает оценку количества всех домашних хозяйств данного региона и страны в целом. Однако их использование позволяет сохранить соответствие выборочной совокупности изначальным принципам формирования выборки, при этом в практике имеют место случаи, нарушающие данное соответствие (отказы от участия в обследовании и другие случаи неполучения данных).

47.  Недополучение ответов от отобранных домашних хозяйств является серьезным недостатком, искажающим результаты обследования. В этих условиях возникает необходимость компенсации недостающих данных. Данная процедура призвана осуществить досчет показателей, т. е. компенсировать недополучение данных выборочного обследования.

48.  Недополучение данных имеет место в случае, когда выборочная единица вообще не участвует в обследовании, либо принимает в нем частичное участие. Для компенсации случаев полного неполучения данных применяется простая схема корректировки весов, путем задания больших весов для всех ответивших домохозяйств в данном населенном пункте. Веса всех ответивших на вопросы домашних хозяйств в данном населенном пункте увеличиваются на один и тот же коэффициент. Например: если 90 процентов домашних хозяйств в ПВЕ ответили на все вопросы, веса для всех ответивших увеличиваются на коэффициент 1/0,9=1,11. Все не давшие ответов домашние хозяйства исключаются из выборки путем задания для каждого из них фактического веса равного нулю.

49.  В случае отсутствия данных только по определенным вопросам применяется метод вменения (импутации) значений. Данный метод заключается в замене отсутствующих данных по отдельной позиции значением, в отношении которого делается прогноз с учетом другой информации, имеющейся по данному объекту или по другим объектам данного обследования.

50.  Рассчитанные персональные веса в качестве дополнительных переменных записываются в базу данных по каждому домашнему хозяйству и используются при формировании сводных итогов по соответствующему кварталу на республиканском и региональном уровнях. Распространенные данные в среднем за год получаются путем объединения квартальных данных.

8. Ротация выборки

51.  В целях недопущения эффекта усталости домохозяйств от участия в обследовании, выборка домашних хозяйств периодически подвергается ротации. Процесс систематической ротации выборки не связан с заменой домохозяйств, отказавшихся участвовать в обследовании.

52.  В целях отслеживания влияния сезонных колебаний и других явлений на одни и те же домохозяйства в течение отчетного года, ротацию целесообразно проводить на начало года, то есть ежегодно в декабре необходимо обновлять выборку.

53.  Ротацию домашних хозяйств (обновление выборки) необходимо проводить ежегодно в размере 1/3 от общего числа обследуемых домашних хозяйств. То есть, ежегодно 1/3 часть домашних хозяйств выводится из выборки и заменяться на другие. Таким образом, по истечении 3-х лет произойдет полное обновление выборки.

54.  В конце года (в декабре) в каждом кластере случайно выбираются 10 домохозяйств и выводятся из выборки. Еще 10 из первоначально отобранных домохозяйств выбираются случайно и выводятся из выборки в конце следующего года, и оставшиеся 10 домохозяйств – в конце последующего года. Каждый раз 10 новых домохозяйств выбираются случайно из актуализированной базы СРЖФ, чтобы занять место выведенных.

55.  При формировании выборки в списке отобранных домашних хозяйств предусмотрено дополнительно поле с признаком ротации. «1» в данном поле означает, что домашнее хозяйство подлежит ротации по истечению первого года, «2» – по истечению второго года и «3» – по истечению третьего года. Таким образом, систематическая ротация осуществляется путем выведения из выборки групп 1, 2 и 3 в конце первого, второго и третьего года.

Приложение

к Методике построения выборки домашних хозяйств по обследованию уровня жизни

Таблица 1. Определение размера выборки

Величина ошибки

Размер выборки:

кол-во домохозяйств,

тыс. единиц

Затраты на обследование,

млн. тенге

по республике

по регионам

Вариант №1

24

800

<1%

<3%

Вариант №2

18

600

<2%

<5%

Вариант №3

12

400

<4%

<7%

Таблица 2. Характеристика оценки точности показателя

доходы, использованные на потребление” по результатам обследования домашних хозяйств по оценке уровня жизни

Доходы, использованные на потребление,

за год в среднем на душу, тенге

Стандартная ошибка выборки

(Sе)

Величина доверительного интервала (Р=0,95), ± тенге

Относительная стандартная ошибка
(RSE), %

нижняя граница

верхняя граница

Республика Казахстан

458743

1191

456409

461077

0,26%

том числе:

городская местность

552761

3613

545681

559841

0,65%

сельская местность

360228

2558

355214

365242

0,71%

Акмолинская область

470134

9124

452252

488016

1,94%

Актюбинская область

472494

8087

456645

488343

1,71%

Алматинская область

535466

8797

518224

552707

1,64%

Атырауская область

415869

6907

402330

429407

1,66%

Западно-Казахстанская область область

416992

8043

401228

432756

1,93%

Жамбылская область

355963

5464

345254

366671

1,53%

Карагандинская область

562665

10796

541505

583824

1,92%

Костанайская область

462741

9229

444652

480829

1,99%

Кызылординская область

393944

6492

381221

406668

1,65%

Мангистауская область

449044

8410

432560

465528

1,87%

Южно-Казахстанская область

307032

3564

300047

314016

1,16%

Павлодарская область

465175

7636

450208

480141

1,64%

Северо-Казахстанская область

461012

10119

441179

480844

2,19%

Восточно-Казахстанская область область область

492494

9188

474487

510502

1,87%

г. Астана

567388

9060

549630

585145

1,60%

г. Алматы

701398

11007

679825

722971

1,57%

Таблица 3. Распределение первичных выборочных единиц по стратам (городская и сельская местность)

Код

Наименование региона

Число домохозяйств

Число ПВЕ

Город

Село

Всего

Город

Село

Всего

11

Акмолинская

115 888

79 089

194 977

12

16

28

15

Актюбинская

133 540

32 803

166 343

12

16

28

19

Алматинская

110 045

260 502

370 547

8

16

24

23

Атырауская

56 823

31 931

88 754

10

8

18

27

Западно-Казахстанская

100 630

76 727

177 357

8

14

22

31

Жамбылская

123 593

117 878

241 471

9

14

23

35

Карагандинская

378 012

66 854

444 866

20

12

32

39

Костанайская

179 666

127 047

306 713

12

15

27

43

Кызылординская

55 226

69 545

124 771

8

12

20

47

Мангыстауская

73 270

16 828

90 098

12

8

20

51

Южно-Казахстанская

232 170

260 099

492 269

10

16

26

55

Павлодарская

190 793

63 953

254 746

12

16

28

59

Северо-Казахстанская

97 757

114 127

211 884

9

13

22

63

Восточно-Казахстанская

299 061

171 035

470 096

14

16

30

71

г. Астана

148 587

-

148 587

22

-

22

75

г. Алматы

386 251

-

386 251

30

-

30

Всего

2 681 312

1 488 418

4 169 730

208

192

400

Таблица 4. Первые и последние строки перечня отобранных первичных выборочных единиц (ПВЕ)

Код

Наименование области

Наименование района

Наименование населенного пункта

Город\село

КАТО

Квартиры

Д/Х

Люди

Вероятность

Отобранные

111010

Акмолинская

Кокшетау г. а.

г. Кокшетау

1

1

45 645

45 003

109 117

4,65998

5

111810

Акмолинская

Степногорск г. а.

г. Степногорск

1

1

21 597

21 084

46 928

2,18321

2

113220

Акмолинская

Аккольский

Аккольская г. а.

1

1

4 403

4 400

13 231

0,45561

1

113820

Акмолинская

Атбасарский

Атбасарский

1

1

9 502

9 428

27 121

0,97625

1

114620

Акмолинская

Ерейментауский

Ерейментауский

1

1

4 034

4 029

10 841

0,41720

1

117020

Акмолинская

Бурабайский

Щучинская г. а.

1

1

13 875

13 674

33 903

1,41592

2

113239

Акмолинская

Аккольский

Ивановский

2

1

374

360

1 249

0,07283

1

113433

Акмолинская

Аршалынский

а. о. Жибек Жолы

2

4

559

558

2 050

0,11289

1

636473

Восточно-Казахстанская

Урджарский

а. о. Маканшы

2

1

3 117

2 773

11 648

0,25941

1

711110

г. Астана

г. Астана

район Алматы

1

1

79 627

81 274

256 464

12,03354

12

751110

г. Алматы

г. Алматы

Алмалинский

1

1

65 939

66 434

168 138

5,15991

5

751910

г. Алматы

Медеуский

Турксибский

1

1

49 333

49 735

151 982

3,86290

4