Обычно на практике расчет объема выборки производят по формуле для повторно отбора:

.

Если полученный объем выборки превышает 5% численности генеральной совокупности, расчеты корректируют «на бесповторность»:

.

Если доля отбора не превышает 5%, к формуле бесповторного отбора можно не переходить, так как это существенно не скажется на величине n.

Полученный на основе использования этих формул результат всегда округляется в большую сторону до целого значения.

При решении задачи определения объема выборки величина допустимой предельной ошибки и уровень вероятности, гарантирующей точность оценок будущей выборки, задаются исследователем. Величина генеральной дисперсии, как правило, неизвестна. Для ее оценки можно использовать:

1.  выборочную дисперсию по данным прошлых или пробных обследований;

2.  дисперсию, найденную из соотношения для среднего квадратического отклонения:

;

3.  дисперсию, определенную из соотношения для асимметричного распределения:

;

4.  дисперсию, вычисленную из соотношения для нормального распределения:

,

где - среднее значение признака в генеральной совокупности; , - соответственно максимальное и минимальное значения признака в генеральной совокупности.

В качестве оценки генеральной дисперсии доли используют максимально возможную дисперсию альтернативного признака:

.

Пример 11.1. Определите, сколько учащихся первых классов района необходимо отобрать в порядке собственно-случайной бесповторной выборки, чтобы с вероятностью 0,997 определить границы среднего роста первоклассников с предельной ошибкой 2 см. Известно, что всего в первых классах школ района обучается 1100 учеников, а дисперсия роста по результатам аналогичного обследования в другом районе составила 24.

НЕ нашли? Не то? Что вы ищете?

Необходимый объем выборки при уровне вероятности 0,997 (t = 3) составит:

Таким образом, для получения данных о среднем росте первоклассников с заданной точностью необходимо обследовать 52 школьника.

Рассмотрим еще один пример.

Пример11.2. Определить численность выборки по следующим данным.

Для определения средней цены говядины на рынках города предполагается произвести выборочную регистрацию цен. Известно, что цены на говядину колеблются от 100 до 160 руб. за 1 кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены не превышала 5 руб. за 1 кг? На момент обследования на рынках города действует 3214 торговых точек.

Предположим, что распределение цен соответствует нормальному распределению. Тогда

руб.

Осуществим расчет объема выборки по формуле повторного отбора с учетом уровня вероятности 0,954 (t = 2):

торговых точек.

Поскольку доля отбора не превышает 5% (16 / 3214 = 0,005, или 0,5%), к формуле бесповторного отбора можно не переходить.

Таким образом, для того чтобы с вероятностью 0,954 гарантировать, что ошибка при определении средней цены говядины не превысит 5 руб. за 1 кг, необходимо обследовать 16 торговых точек на рынках города.

Иногда на практике задается не абсолютная величина предельной ошибки выборки, а ее относительный уровень – отношение предельной ошибки выборки к среднему значению признака, выраженное в процентах. Эта величина называется относительной ошибкой выборки и характеризует относительную погрешность выборочного наблюдения:

.

Расчет объема выборки при заданном уровне относительной ошибки выборки осуществляется по формулам:

, ,

где v – коэффициент вариации;

.

Пример 11.3.. В городе зарегистрировано 30 тыс. безработных. Для определения средней продолжительности безработицы организуется выборочное обследование. По данным прошлых лет известно, что коэффициент вариации продолжительности безработицы составляет 40%. Какое число безработных необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997 утверждать, что полученная предельная ошибка выборки не превышает 5% средней продолжительности безработицы?

Доверительной вероятности 0,997 соответствует коэффициент доверия t = 3.

Расчет численности выборки осуществляется по формуле для бесповторного отбора:

человек.

Таким образом, для того чтобы с вероятностью 0,997 утверждать, что полученная ошибка выборки не превышает 5% средней продолжительности безработицы, необходимо охватить выборочным наблюдением 566 безработных.

Механическая выборка. Данная выборка заключается в отборе единиц из общего списка единиц генеральной совокупности через равные интервалы в соответствии с установленным процентом отбора. При решении задач на определение средней ошибки механической выборки, а также необходимой ее численности, следует использовать приведенные выше формулы, применяемые при собственно-случайном бесповторном отборе.

Типическая выборка. Эта выборка применяется в тех случаях, когда единицы генеральной совокупности объединены в несколько крупных типичных групп. Отбор единиц в выборку про изводится внутри этих групп пропорционально их объему на основе использования собственно-случайной или механической выборки.

Средняя ошибка типической выборки определяется по формулам:

при повторном отборе: ;

при бесповторном отборе: ,

где - средняя из внутригрупповых дисперсий.

Пример11.4.. В целях изучения доходов населения по трем районам области сформирована 2%-ная выборка, пропорциональная численности населения этих районов. Полученные результаты представлены в табл. 11.3.

Таблица 11.3. Результаты выборочного обследования доходов населения

Район

Численность населения, чел.

Обследовано,

чел.

Доход в расчете на 1 человека

средняя, тыс. руб.

дисперсия

I

II

III

120 000

170 000

90 000

2400

3400

1800

2,9

2,5

2,7

1,3

1,1

1,6

Необходимо определить границы среднедушевых доходов населения по области в целом при уровне вероятности 0,997.

Рассчитаем среднюю из внутригрупповых диспер­сий:

.

Определим среднюю и предельную ошибки выборки:

; .

Рассчитаем выборочную среднюю:

тыс. руб.

В результате проведенных расчетов с вероятностью 0,997 можно сделать вывод, что среднедушевые доходы жителей данной области находятся в следующих границах (тыс. руб.):

.

При определении необходимого объема типической выборки учитывается средняя из внутригрупповых дисперсий:

,

Полученное значение общего объема выборки необходима распределить по типическим группам пропорционально их чис­ленности, чтобы определить, какое количество единиц следует отобрать из каждой группы:

,

где - объем i-й группы; - объем выборки из i-й группы.

Серийная выборка. Эта выборка используется в тех случаях, когда единицы изучаемой совокупности объединены в небольшие равновеликие группы или серии. Единицей отбора в этой случае является серия. Серии отбираются с использованием собственно-случайной либо механической выборки, а внутри отобранных серий обследуются все без исключения единицы.

В основе расчета средней ошибки серийной выборки лежит межгрупповая дисперсия:

при повторном отборе: ;

при бесповторном отборе: ,

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15