Отбор единиц в выборочную совокупность может быть повторным или бесповторным. При повторном отборе попавшая в выборку единица подвергается обследованию, а затем возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Тем самым вероятность попадания каждой отдельной единицы в выборку остается постоянной на всем протяжении отбора. При бесповторном отборе попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует. Поэтому вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора.
Выборочное наблюдение, как бы грамотно с методологической точки зрения оно ни было организовано, всегда связано с определенными, пусть небольшими и измеряемыми ошибками. Случайные ошибки выборки обусловлены действием случайных факторов, не содержащих каких-либо элементов системного направления воздействия на рассчитываемые выборочные характеристики. Даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Поэтому получаемые случайные ошибки должны быть статистически оценены и учтены при распространении результатов выборочно наблюдения на всю генеральную совокупность. Оценка таких ошибок и является основной задачей, решаемой в теории выборочного наблюдения. Обратной задачей является определение такой минимально необходимой численности выборочной совокупности, при которой ошибка не превысит заданной величины.
Собственно-случайная выборка. Ее суть заключается в отборе единиц из генеральной совокупности в целом, без разделения ее на группы, подгруппы или серии отдельных единиц. При этом единицы отбираются в случайном порядке, не зависящем ни от последовательности расположения единиц в совокупности, ни от значений их признаков. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
После проведения отбора определяются границы генеральных характеристик. Для этого рассчитываются средняя, предельная, и относительная ошибки выборки.
Средняя ошибка повторной собственно-случайной выборки определяется следующим образом:
при повторном отборе:
,
при бесповторном отборе:
,
где
- дисперсия признака в генеральной совокупности; п — объем (число единиц) выборочной совокупности; N – численность генеральной совокупности.
Величина (
) всегда меньше единицы, поэтому сопоставление приведенных формул свидетельствует о том, что применение бесповторного отбора обеспечивает меньшую ошибку выборки.
На практике величина дисперсии признака в генеральной совокупности (
), как правило, неизвестна, поэтому ее заменяют выборочной дисперсией (
). Это возможно, поскольку доказано, что соотношение
и
определяется равенством:
.
При большой численности выборочной совокупности сомножитель (
) стремится к единице и им можно пренебречь.
Величина дисперсии доли в генеральной совокупности определяется по формуле
,
где p – доля единиц, обладающих каким-либо значением признака в генеральной совокупности.
При расчете средней ошибки выборочной доли дисперсия доли в генеральной совокупности, как правило, тоже неизвестна, поэтому ее заменяют дисперсией доли в выборочной совокупности:
,
где w – доля единиц, обладающих каким-либо значением признака в выборочной совокупности.
Формулы для расчета средней ошибки выборочной доли соответственно для повторного и бесповторного отборов имеют вид:
,
.
Предельная ошибка выборки (
) представляет собой t-кратную среднюю ошибку:
,
где t - коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.
Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t.
P(t) | 0,683 | 0,950 | 0,954 | 0,990 | 0,997 |
t | 1,00 | 1,96 | 2,00 | 2,58 | 3,00 |
Проявление ошибки большей, чем утроенная средняя ошибка выборки, имеет крайне малую вероятность (1 – 0,997 = 0,003) и считается практически невозможным событием.
Зная величину выборочной средней (
) или доли (w), а также предельную ошибку выборки (
), можно определить доверительные интервалы, в которых находятся значения генеральных параметров:
,
.
Пример. В результате выборочного обследования незанятого населения, ищущего работу, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 11.1).
Таблица 11.1. Результаты выборочного обследования незанятого населения
Возраст, лет | до 25 | 25-35 | 35-45 | 45-55 | 55 и более |
Численность лиц данного возраста | 15 | 37 | 71 | 45 | 22 |
С вероятностью 0,954 определите границы:
а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого населения.
Для определения средней ошибки выборки нам необходимо прежде всего рассчитать выборочную среднюю величину и дисперсию изучаемого признака (табл. 11.2):
Таблица 11.2. Расчет среднего возраста незанятого населения и дисперсии
Возраст, лет | Численность лиц данного возраста ( f ) | Середина интервала ( |
|
|
До 25 25-35 35-45 45-55 55 и более | 15 37 71 45 22 | 20 30 40 50 60 | 300 1110 2840 2250 1320 | 6000 33300 113600 112500 79200 |
Итого | 190 | - | 7820 | 344600 |
,
.
Средняя ошибка выборки составит:
года.
Определим с вероятностью 0,954 (t = 2) предельную ошибку выборки:
года.
Установим границы генеральной средней:
41,2-1,6
41,2 + 1,6 или 39,6
42,8.
Таким образом, на основании проведенного выборочного исследования с вероятностью 0,954 можно заключить, что средний возраст незанятого населения, ищущего работу, лежит в пределах от 40 до 43 лет.
Для ответа на вопрос, поставленный в пункте «б» данного примера, по выборочным данным определим долю лиц в возрасте до 25 лет и рассчитаем дисперсию доли:
;
.
Рассчитаем среднюю ошибку выборки:
.
Предельная ошибка выборки с заданной вероятностью составит:
.
Определим границы генеральной доли:
0,079 - 0,04
0,079 + 0,04 или 0,039
0,119.
Следовательно, с вероятностью 0,954 можно утверждать, что доля лиц в возрасте до 25 лет в общей численности незанятого населения находится в пределах от 3,9 до 11,9%.
При проектировании выборочного наблюдения решается задача нахождения необходимой численности выборки, обеспечивающей определенную точность расчета оценок генеральных параметров.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |


