Отбор единиц в выборочную совокупность может быть повторным или бесповторным. При повторном отборе попавшая в выборку единица подвергается обследованию, а затем возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Тем самым вероятность попадания каждой отдельной единицы в выборку остается постоянной на всем протяжении отбора. При бесповторном отборе попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует. Поэтому вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора.

Выборочное наблюдение, как бы грамотно с методологической точки зрения оно ни было организовано, всегда связано с определенными, пусть небольшими и измеряемыми ошибками. Случайные ошибки выборки обусловлены действием случайных факторов, не содержащих каких-либо элементов системного направления воздействия на рассчитываемые выборочные характеристики. Даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Поэтому получаемые случайные ошибки должны быть статистически оценены и учтены при распространении результатов выборочно наблюдения на всю генеральную совокупность. Оценка таких ошибок и является основной задачей, решаемой в теории выборочного наблюдения. Обратной задачей является определение такой минимально необходимой численности выборочной совокупности, при которой ошибка не превысит заданной величины.

НЕ нашли? Не то? Что вы ищете?

Собственно-случайная выборка. Ее суть заключается в отборе единиц из генеральной совокупности в целом, без разделения ее на группы, подгруппы или серии отдельных единиц. При этом единицы отбираются в случайном порядке, не зависящем ни от последовательности расположения единиц в совокупности, ни от значений их признаков. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.

После проведения отбора определяются границы генеральных характеристик. Для этого рассчитываются средняя, предельная, и относительная ошибки выборки.

Средняя ошибка повторной собственно-случайной выборки определяется следующим образом:

при повторном отборе:

,

при бесповторном отборе:

,

где - дисперсия признака в генеральной совокупности; п — объем (число единиц) выборочной совокупности; N – численность генеральной совокупности.

Величина () всегда меньше единицы, поэтому сопоставление приведенных формул свидетельствует о том, что применение бесповторного отбора обеспечивает меньшую ошибку выборки.

На практике величина дисперсии признака в генеральной совокупности (), как правило, неизвестна, поэтому ее заменяют выборочной дисперсией (). Это возможно, поскольку доказано, что соотношение и определяется равенством:

.

При большой численности выборочной совокупности сомножитель () стремится к единице и им можно пренебречь.

Величина дисперсии доли в генеральной совокупности определяется по формуле

,

где p – доля единиц, обладающих каким-либо значением признака в генеральной совокупности.

При расчете средней ошибки выборочной доли дисперсия доли в генеральной совокупности, как правило, тоже неизвестна, поэтому ее заменяют дисперсией доли в выборочной совокупности:

,

где w – доля единиц, обладающих каким-либо значением признака в выборочной совокупности.

Формулы для расчета средней ошибки выборочной доли соответственно для повторного и бесповторного отборов имеют вид:

, .

Предельная ошибка выборки () представляет собой t-кратную среднюю ошибку:

,

где t - коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.

Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t.

P(t)

0,683

0,950

0,954

0,990

0,997

t

1,00

1,96

2,00

2,58

3,00

Проявление ошибки большей, чем утроенная средняя ошибка выборки, имеет крайне малую вероятность (1 – 0,997 = 0,003) и считается практически невозможным событием.

Зная величину выборочной средней () или доли (w), а также предельную ошибку выборки (), можно определить доверительные интервалы, в которых находятся значения генеральных параметров:

,

.

Пример. В результате выборочного обследования незанятого населения, ищущего работу, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 11.1).

Таблица 11.1. Результаты выборочного обследования незанятого населения

Возраст, лет

до 25

25-35

35-45

45-55

55 и более

Численность лиц данного возраста

15

37

71

45

22

С вероятностью 0,954 определите границы:

а) среднего возраста незанятого населения;

б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого населения.

Для определения средней ошибки выборки нам необходимо прежде всего рассчитать выборочную среднюю величину и дисперсию изучаемого признака (табл. 11.2):

Таблица 11.2. Расчет среднего возраста незанятого населения и дисперсии

Возраст,

лет

Численность лиц данного возраста ( f )

Середина интервала ()

До 25

25-35

35-45

45-55

55 и более

15

37

71

45

22

20

30

40

50

60

300

1110

2840

2250

1320

6000 33300

113600

112500 79200

Итого

190

-

7820

344600

, .

Средняя ошибка выборки составит:

года.

Определим с вероятностью 0,954 (t = 2) предельную ошибку выборки:

года.

Установим границы генеральной средней:

41,2-1,641,2 + 1,6 или 39,642,8.

Таким образом, на основании проведенного выборочного исследования с вероятностью 0,954 можно заключить, что средний возраст незанятого населения, ищущего работу, лежит в пределах от 40 до 43 лет.

Для ответа на вопрос, поставленный в пункте «б» данного примера, по выборочным данным определим долю лиц в возрасте до 25 лет и рассчитаем дисперсию доли:

; .

Рассчитаем среднюю ошибку выборки:

.

Предельная ошибка выборки с заданной вероятностью составит:

.

Определим границы генеральной доли:

0,079 - 0,040,079 + 0,04 или 0,039 0,119.

Следовательно, с вероятностью 0,954 можно утверждать, что доля лиц в возрасте до 25 лет в общей численности незанятого населения находится в пределах от 3,9 до 11,9%.

При проектировании выборочного наблюдения решается задача нахождения необходимой численности выборки, обеспечивающей определенную точность расчета оценок генеральных параметров.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15