= 140,2 г/м2;
= 139 г/м2; σ = 18,3 г/м2;
= 68,306 = const.
По данным таблицы построим кривые теоретического и фактического распределения частот (рис. 6.7).
![]()
![]()

Рис. 6.7
На графиках (см. рис.6.7) видна большая близость фактических частот распределения вариант к теоретическим. Но эту близость надо оценить количественно.
3.3. Критерий согласия
Критерий согласия – это статистический показатель, по которому можно судить, на сколько фактическое распределение согласуется с нормальным (теоретическим). Таких показателей имеется несколько видов.
Выберем критерий согласия (критерий лямбда):
, (6.14)
где Д – максимальная разность (по абсолютной величине) между кумулятивными фактическими и теоретическими частотами исследуемого ряда.
В таблице примера 6.5 Д = 6.
.
По специальной таблице, называемой «таблица функции
» находим, что при λ = 0,55
= 0,9229, что означает, что с вероятностью 0,9229 можно утверждать, что отклонение фактических частот от теоретических является случайным.
Вопросы и задания для самоконтроля
1. Что такое размах вариации и в чем его особенности как показателя вариации?
2. Назовите основные показатели вариации.
3. Как определяется дисперсия, среднее квадратическое отклонение и что такое коэффициент вариации?
4. Что представляет собой правило сложения дисперсии?
5. Что показывает эмпирическое корреляционное отношение, формула его расчета?
6. В чем особенности анализа характера распределения в вариационных рядах?
7. Как определяется критерий согласия лямбда?
Лекция 7. Выборочное наблюдение
Статистика далеко не всегда имеет дело с данными сплошного наблюдения, наоборот, ей чаще приходится иметь дело с несплошной выборкой.
1. Понятие о выборочном наблюдении и его задачах.
2. Репрезентативность выборки и методы её достижения.
3. Ошибки выборки, численность выборки.
4. Моментные наблюдения и малая выборка.
1. Понятие о выборочном наблюдении и его задачах
1.1. Выборочное наблюдение и его задачи (рис. 7.1)
Рис. 7.1
Метод основного массива заключается в том, что обследованию подвергаются наиболее крупные, существенные единицы наблюдения.
Сущность выборочного наблюдения: обследованию подлежит определённое число единиц, отобранных из генеральной совокупности в порядке случайного (но не бессистемного) отбора с целью вывода обобщающих характеристик генеральной совокупности.
| Согласно теории вероятностей выборочная совокупность будет правильно отражать свойства всей совокупности, если выбор производится случайно, то есть так, что любая из возможных выборочных совокупностей заданной численности n из всей совокупности численностью N имеет возможность быть выбранной (рис.7.2). |
Рис.7.2 |
Две главные и взаимосвязанные проблемы выборочного наблюдения:
■ расчет объёма выборочной совокупности при заданной точности исследования (точности характеристик генеральной совокупности);
■ определение, так называемой, ошибки выборки (возможной величины расхождения с той или иной из характеристик генеральной совокупности) при данной её численности.
Основные этапы выборочного наблюдения:
1) формулировка цели наблюдения;
2) ограничение генеральной совокупности и подготовка основы отбора;
3) установление системы отбора единиц для наблюдения;
4) определение числа единиц, подлежащих отбору;
5) проведение наблюдения;
6) расчёт выборочных характеристик и их ошибок;
7) распространение выборочных данных (характеристик с поправками на ошибки) на генеральную совокупность.
На рис. 7.3 приведена укрупнённая последовательность выборочного наблюдения
Распространение выводных
характеристик
Рис.7.3
Рис. 7.3
Итак, задача выборочного наблюдения заключается в том, чтобы получить правильное представление о характеристиках (показателях) всей генеральной совокупности.
1.2. Ситуации, при которых используется выборочное наблюдение:
1) в том случае, когда статистическое исследование связано с порчей единиц совокупности;
2) в том случае, когда сплошное наблюдение требует больших затрат тех или иных видов ресурсов;
3) когда есть основание предполагать, что большое количество единиц наблюдения, а значит, и количество наблюдателей приводит к таким тенденциозным ошибкам, которые исказят характеристики исследуемой генеральной совокупности.
Выборочную совокупность принято называть выборкой. Выборка должна отражать (представлять) генеральную совокупность через соответствующие характеристики (показатели, признаки).
2. Репрезентативность выборки и методы её достижения
Representant (фр.) – представлять; репрезентативность – представительность.
2.1. Описательная и выводная статистика
Любая генеральная совокупность имеет свои характеристики (показатели, параметры). Но, как уже говорилось, мы часто не можем их рассчитать непосредственно через наблюдение всех членов, а выводим через наблюдение за выборкой.
Набор характеристик совокупности, по которой полностью имеются исходные данные (например, выборка), называется описательной статистикой, а те характеристики, которые получаются методами статистического вывода из данных описательной статистики для генеральной совокупности называются выводной статистикой.
Примечание 7.1: представление о статистических данных, как о выборочных, часто распространяется и на данные сплошных наблюдений.
Такое представление имеет смысл в следующих случаях:
а) когда генеральная совокупность имеет малое число единиц;
б) при трактовке данных какого-либо-эксперимента, который гипотетически надо было бы для точности повторять бесконечное количество раз.
Кончено, между параметрами выборки и параметрами генеральной совокупности (если бы они были рассчитаны напрямую) будут расхождения.
Расхождение между значениями того или иного показателя (признака) совокупности выборочной и генеральной совокупности носит название ошибки выборки (ошибки репрезентативности) (рис. 7.4).
| |
![]() |
Рис. 7.4
Случайная ошибка возникает в силу того, что выборочная совокупность недостаточно точно воспроизводит (репрезентует) генеральную совокупность, но на неё (ошибку) можно по существующим правилам вывода сделать поправку.
Систематическая ошибка выборки (представительности) возникает вследствие нарушения системы отбора, главным образом, принципа беспристрастности, непреднамеренности. Систематическая ошибка может привести к полной непригодности результаты наблюдения.
2.2. Отбор единиц генеральной совокупности для выборочного наблюдения
Этот процесс должен носить характер беспристрастности и случайности (но не бессистемности).
Процессы отбора классифицируются по видам (обеспечение принципа случайности) и способам (техника отбора по охвату генеральной совокупности) (рис. 7.5).
Отбор
По видам по способам
(обеспечение принципа (техника отбора
случайности) по охвату ГС)
Рис. 7.5. Классификация процессов отбора.
2.3. Виды отбора
1. Собственно случайный отбор.
2. Случайный отбор единиц из генеральной совокупности по определённой схеме.
♦ Собственно-случайный отбор.
Рассчитывается численность выборки, составляется «список» единиц генеральной совокупности с присвоением каждой единице цифрового кода, затем по принципу лототрона или с помощью таблиц случайных чисел отбираются единицы генеральной совокупности до достижения рассчитанной численности выборки.
♦ Отбор единиц по определённой схеме (направленная выборка).
1. Механический отбор.
Рассчитывается численность выборки, составляется «список» всех единиц генеральной совокупности, определяется интервал выборки (i):
. (7.1)
Затем отбор начинается с любой единицы генеральной совокупности с переходом к следующей по номеру единице через интервал; должен быть обеспечен полный круг отбора, т. е. если отбор начался с j-й единицы, то закончен должен быть «j – i»-й.
Иногда объём выборки назначают в относительных величинах, например: 5%-я, 10%-я и т. п. выборка; тогда интервал выборки рассчитывается так:
, (7.2)
где ρ – заданный процент выборки.
2. Типический отбор с механической выборкой.
В этом случае схема должна отражать основные свойства и пропорции ГС.
Такой отбор производится тогда, когда простой механический отбор может привести к образованию неоднородной по исследуемому показателю выборке.
Пример 7.1:
Исследуется динамика доходов граждан города Камышина. Выборке подлежат 1000 человек. Простая механическая выборка может привести к тому, что в выборке будет превалировать по численности одна–две социальные группы (например, посредники, чиновники).
Следует изучить структуру 130-тысячного населения города (процентное соотношение социальных групп) и так организовать процесс отбора, чтобы выборка повторяла эту структуру. В социальных же группах генеральной совокупности производится или собственно случайный или простой механический отбор.
Примечание 7.2: такой отбор, который повторяет структуру генеральной совокупности через определение количества единиц, отбираемых для выборки из каждой группы генеральной совокупности, часто называют квотной выборкой, а также – стратифицированной.
2.4. Способы отбора
♦ Повторный и бесповторный отборы.
Если в процессе отбора раз отобранная единица совокупности не исключается из неё, и, следовательно, может быть вновь (повторно) отобранной, то такой отбор называется повторным или возвратным, в противном случае – бесповторным.
Статистические исследования в социально-экономических системах производятся, как правило, бесповторным способом, но теория ошибок выборки основана на представлениях о повторной выборке (с последующими поправками на бесповторность).
♦ Отбор индивидуальный и отбор групповой (серийный, гнездовой).
При индивидуальном отборе за каждую итерацию (шаг) отбирается только одна единица генеральной совокупности, следовательно, отбор повторяется столько раз, сколько нужно отобрать единиц.
При групповом (серийном) отборе отбираются не отдельные единицы, а целые их группы (серии), например, отбор какого-либо товара группами по 10 единиц или деталей сериями 100 единиц (рис. 7.6).
При комбинированном отборе вначале по принципу случайности отбираются группы, а из них по этому же принципу – единицы совокупности.
Рис. 7.6. Способы серийного отбора
♦ Отбор одноступенчатый и отбор многоступенчатый.
При одноступенчатом отборе единицы отбираются непосредственно из генеральной совокупности для совокупности выборочной.
При многоступенчатом отборе сначала отбираются укрупненные единицы генеральной совокупности, а из каждой из них менее укрупненные и т. д. до такой ступени, при которой обеспечивается заданная единица измерения членов совокупности.
Пример 7.2:
Отбор домохозяйств при изучении потребления продуктов питания населения крупного города можно произвести по ступенчатой схеме (рис. 7.7).
Ступени Ед. измерения:
I ст. Отбор микрорайонов микрорайон
![]()
![]()
![]()
• • • • • •
II ст. Отбор жилых домов жилой дом
![]()
![]()
• • • •
III ст. Отбор домохозяйств домохозяйство
Рис. 7.7
Примечание 7.3: на каждой ступени соблюдается принцип случайности, а при большой сосредоточенности тех или иных социальных групп по микрорайонам – и принцип типичности.
Следует заметить, что при многоступенчатом отборе каждая ступень имеет свою единицу отбора.
♦ Многофазовая выборка.
При этом виде выборки единицы совокупности последовательно группируются по детализации ценза объекта наблюдения.
Пример 7.3:
Земскими статистиками в Пензенской губернии была проведена перепись крестьянских хозяйств по следующей схеме:
● все хозяйства: по трём признакам;
● каждое третье хозяйство: плюс ещё два дополнительных признака;
● каждое девятое хозяйство: плюс ещё два дополнительных признака;
● каждое двадцатое хозяйство: перечень по карточке, содержащей количество признаков, подробно описывающих параметры крестьянского хозяйства.
Примечание 7.4. (историческая справка):Земство (земские учреждения) – выборные органы местного самоуправления; ведали просвещением, здравоохранением, строительством дорог; ресурсы земства формировались за счёт земских повинностей (натуральных и денежных).
Земская статистика: статистическая работа земств по исследованию сельского хозяйства; с 1870 года по 1913 год ею собран материал (описи) 4,5 млн. крестьянских хозяйств.
3. Ошибки выборки; численность выборки
3.1. Обозначения параметров (показателей, характеристик) (табл. 7.1)
Таблица 7.1
Генеральная совокупность | Выборочная совокупность | |
Средняя величина | µ (мю) |
|
Относительная величина | π (пи) | ρ (пе) |
Дисперсия | σ2 (сигма) | S2 (эс) |
Среднеквадратическое отклонение | σ | S |
Коэффициент корреляции | р (эр) | r (эр) |
Численность (объём) | N (эн) | n (эн) |
3.2. Виды ошибок репрезентативности выборочной совокупности
1. Ошибка репрезентативности выборочной средней:
. (7.3)
2. Ошибка репрезентативности выборочной относительной величины:
. (7.4)
3. Ошибка репрезентативности дисперсии:
. (7.5)
4. Ошибка репрезентативности коэффициента корреляции:
. (7.6)
3.3. Гипотетическая средняя квадратическая ошибка репрезентативности выборочной средней
Гипотеза: если бы была определена средняя генеральная совокупности, то можно было бы сделать серию повторных выборок, определить в каждой из них среднее значение изучаемого признака, а затем определить среднеквадратическое отклонение (среднеквадратическую ошибку) выборки:
, (7.7)
где е – номер очередной выборки; fе – частота этой выборки, т. е. сколько раз она «вынималась» из генеральной совокупности;
– средняя в выборке за номером «е».
Но поскольку мы предполагаем, что генеральная средняя арифметическая нам не известна и предполагается бесповторная выборка, использовать формулу (7) в практических целях нельзя.
3.4. Практический расчёт среднеквадратической ошибки выборочной средней
♦ Общие посылки.
1. За исходную посылку принимается схема повторной выборки; но в последующем должна быть сделана поправка на бесповторность.
2. При соблюдении принципа случайного отбора величину ошибки выборки определяют следующие факторы:
● численность выборки: чем больше численность выборки, тем меньше величина ошибки выборки;
● степень варьирования признака: например, если признак совсем не варьирует, то его дисперсия будет равна нулю и, значит, никакой ошибки средней не будет.
Отсюда квадрат средней ошибки выборки (
) можно теоретически рассчитать по следующей формуле:
, (7.8)
где σ2 – дисперсия генеральной совокупности.
Среднеквадратическая ошибка выборочной средней (теоретическая):
. (7.9)
♦ Практические формулы для расчёта средней ошибки выборочной средней.
Вернемся к формуле (7.9), она предполагает две посылки:
Первая – предполагается известной дисперсия генеральной совокупности (σ2).
Вторая – предполагается повторная выборка.
По поводу первой ссылки: нам ничего другого не остаётся, как предположить, что S2 (дисперсия выборки) близка к σ2 (дисперсия ГС).
По поводу второй посылки: при бесповторной выборке численность единиц генеральной совокупности сокращается на 1 после каждой интеграции в процессе выборки, поэтому в подкоренное выражение формулы (9) добавляется множитель
.
Итак, формула (7.9) преобразуется так:
, (7.10)
где
– сокращённо называется средней ошибкой выборки.
Для признаков, выраженных в относительных величинах (например, в долях).
. (7.11)
Однако полной уверенности в том, что при поправке выборочной средней на полученную ошибку выборки нет, ибо слишком много было предпосылок.
♦ Предельная ошибка выборочной средней.
Если наша ГС подчиняется закону нормального распределения, то мы можем констатировать следующее: выборочная средняя обязательно попадёт в зону «µ ± 3σ», вполне вероятно в зону «µ ± 2σ» и может быть в «µ ± σ», то есть:
с вероятностью 68,3 %
= «µ ± σ»;
с вероятностью 95,4 %
= «µ ± 2σ»;
с вероятностью 99,7 %
= «µ ± 3σ»;
в общем виде
= «µ ± tσ».
. (7.12)
Это отношение называется нормированным отклонением ошибки выборки (кратности ошибки выборки, коэффициент доверия).
Расчёт средней ошибки выборки по формулам (7.10) и (7.11) может быть принят при вероятности 0,6827, а общая формула принимаемой в расчёт ошибки выборки будет такой:
, (7.13)
где
называется предельной ошибкой выборки; отношение (коэффициент) t иногда называется коэффициентом кратности ошибки выборки, нормированным отношением ошибки выборки или коэффициентом доверия.
Для признаков, выраженных в долях:
, (7.14)
Связь между значениями t и вероятностью определяется по таблице, построенной на основании уравнения Лапласа – Гаусса (табл. 7.2).
Таблица 7.2
Выдержка из таблицы значений интеграла вероятностей
t | Вероятность |
1,0 | 0,6827 |
1,1 | 0,7287 |
• | • |
2,0 | 0,9545 |
• | • |
3,0 | 0,9973 |
Уточнения к формулам (7.10) и (7.11):
● при механическом отборе по нейтральному группировочному признаку S2 принимается общая дисперсия; при типическом отборе с механической выборкой за S2 принимается средняя внутригрупповых дисперсий;
● в некоторых источниках в подкоренное выражение формулы (7.9) вместо множителя
предлагается вводить множитель
.
Пример 7.4:
1. Средняя продолжительность горения лампочки по выборочным данным составила 300 часов, ошибка выборки (
) рассчитана как 10 часов. тогда среднюю продолжительность горения любой лампочки из партии можно отсчитать как (300 ± 10) часов с вероятностью 0,6827, а с вероятностью 0,9545 как (300 ± 20) часов.
2. Выборочному обследованию подвергли качество произведённого кирпича. Взято 1600 проб из партии в 20000 штук, в 32 случаях кирпич забраковали. Требуется определить с вероятностью 0,954 (t = 2) в каких пределах заключается доля брака во всей продукции. Используем формулы (7.11) и (7.14):
= 0,0035 или 0,35 %.
3.5. Объём (численность) выборки
Численность выборки рассчитывается на стадии проектирования выборочного наблюдения. За основу принимаются формулы расчёта ошибки повторной выборки.
, (7.15)
, (7.16)
где индекс «п» обозначает «повтор».
Из последней формулы:
. (7.17)
Для бесповторной выборки формула (7.17) преобразуется:
. (7.18)
В формуле (7.17) проблемной является составляющая σ2 , т. е. дисперсия генеральной совокупности, поэтому она принимается по данным аналогичных исследований в предшествующих периодах или пробных выборочных наблюдений по схеме повторной выборки;
задаётся проектировщиками.
Пример 7.5:
По данным многочисленных наблюдений на скальных земляных работах на одной из крупных строек средняя выработка определена в 4,95 м3 на одного рабочего, а средний квадрат отклонения оказался равным 2,25 (среднеквадратическое отклонение 1,5 м3). На стройке намерены внедрить новый инструмент для землекопов. Для эксперимента нужно определить количество рабочих (своеобразную выборку), чтобы затем подсчитать новую выработку, при этом размер ошибки по выработке не должен превышать Δ = 0,2 м3 с вероятностью 0,954 (t = 2):
(рабочих) по формуле (7.17).
Выборку предстоит осуществить из 2000 рабочих:
(рабочих) по формуле (7.18).
3.6. Оценка предпринимательского риска
Пример 7.6:
На заводе безалкогольных напитков изготавливается напиток «Шикарный» с разливом в бутылки. По опыту известно, что через 1400 часов хранения может случиться потеря некоторых качеств напитка. Отобрали партию в 100 бутылок (объём выборки рассчитан с учётом её бесповторности) и со дня разлива, начиная с 1400 часов до 1430 часов хранения, отбирали для проб по три-четыре бутылки. Средняя продолжительность живучести оказалось 1420 часов, со среднеквадратическим отклонением 61,03 часа. Пользуемся формулой (7.10) без поправок на бесповторность выборки, т. к. она учтена при определении численности выборки:
часа.
Предприниматель считает, что предельная ошибка выборки может быть доведена до 10.
Используем формулу (13):
= 1,64; ему соответствует доверительная вероятность dв = 0,899.
Вероятность того, что предельная ошибка в проведённых испытаниях составила более десяти часов и равна:
т. е. 5 %.
Предприниматель с риском в 5 % разрешает подчинённым хранить напиток 1410 часов (1420 – 10).
3.7. Алгоритмы применения формул ошибки выборки и её численности
1)
среднеквадратичная ошибка
![]() |
;
;
;
;
2) численность выборки:
![]()
![]()
![]()

![]()
![]()
▪ по аналогии ▪ задаётся при
▪ эмпирические данные проектировании
4. Моментные наблюдения и малая выборка
4.1. Моментные наблюдения
Моментное наблюдение заключается в том, что на определённые моменты времени фиксируется наличие (отсутствие) отдельных элементов изучаемого процесса.
Пример 7.7:
В цехе должно работать 20 отлаженных станков. За восьмичасовую смену каждые полчаса проводились моментные регистрации состояния станков. Всего было сделано 320 отметок (20 × 16). В 288 случаях сделана отметка о работе, а в 32-х – о простое станков, т. е. доля работающих станков составила 0,9.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |





