3) Ошибки выборочного исследования

Методы отбора единиц наблюдения

В целом методы сбора данных могут быть разделены на сплошные и несплошные.

Сплошное статистическое наблюдение требует полного охвата объекта исследования, всех его элементов без исключения.

Наиболее часто в социологии используются три метода несплошного наблюдения 1. Монографический, 2 Метод основного массива, 3 Выборочный

Особенностью монографического метода является то, что он применяется для изучения типичных объектов социологического исследования. Метод монографического исследования предполагает статистическое наблюдение некоторой части исследуемой совокупности, которое здесь подкрепляет основные выводы качественного описания, поэтому выборка объектов наблюдения осуществляется с учетом конкретной направленности исследования.

Методом основного массива, как правило, изучается большая часть объекта социологического исследования или ею важнейшие элементы. Этот метод находит применение, например, в некоторых социологических исследованиях, проводимых с помощью контент-анализа.

Наиболее широкое распространение в социологических исследованиях получил выборочный метод, который предлагает различные способы отбора единиц объекта для проведения иссследования.

Основные понятия выборочного метода

Генеральная совокупность – это множество социальных объектов, которые являются предметом изучения в пределах, очерченных программой социологического исследования и территориально-временными границами.

Несомненно, генеральная совокупность – это та совокупность, из которой производится выборка единиц. Однако так только кажется. Выборка производится из той совокупности, из которой производится фактический отбор респондентов. Назовем ее реальной. Различия между проектируемой и реальной совокупностями можно увидеть воочию, сравнив списки «проектированных» респондентов и опрошенных фактически.

НЕ нашли? Не то? Что вы ищете?

Выборочная совокупность это часть объектов генеральной совокупности, выступающих: в качестве объектов наблюдения. Иными словами, если генеральная совокупность включает вес без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральном совокупности. При этом статистическое наблюдение осуществляется именно за элементами выборочной совокупности.

Единицей отбора называют элементы генеральной совокупности, которые выступают единицами счета в различных процедурах отбора, формирующих выборку.

Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются статистическому наблюдению. Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования.

Выборка в определенном смысле должна быть моделью генеральной совокупности, что и позволяет на се основе оценивать характеристики этой совокупности. Репрезентативность - это свойство выборки отражать, моделировать характеристики генеральной совокупности, достаточно лишь значимых с точки зрения задач исследования.

Основой выборки называют перечень элементов генеральной совокупности, если он удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц наблюдения. Основой могут служить алфавитные списки сотрудников учреждения, номера пропусков, по которым идентифицировать определенные единицы, и т. п.

Ошибки выборочного исследования.

Систематические и случайные ошибки статистического наблюдения. При получении социальной информации выборочным методом могут возникать ошибки различного рода. Эти ошибки, называемые иногда ошибками регистрации, могут быть разделены на два типа: случайные и систематические.

Систематическая ошибка регистрации носит неслучайный характер и представляет собой некую постоянную или закономерно изменяющуюся величину, на которую измеряемые характеристики выборочной совокупности отличаются от характеристик генеральной совокупности. Систематическая ошибка может быть значительной по своей величине из-за одностороннего искажения (в сторону увеличения или уменьшения) исследуемой характеристики.

Случайные ошибки регистрации имеют вероятностную природу и складываются из различных статистических погрешностей в процессе наблюдения. В отличие от систематической случайная ошибка вызывается при наблюдении причинами, носящими вероятностный характер. Поэтому эти ошибки имеют различную направленность в отдельных единицах наблюдения и проявляют тенденцию к взаимному погашению при обобщении результатов регистрации по всей исследуемой совокупности.

Корректировка выборкиэто процедура приведения структуры совокупности выборочной (см.) в соответствие со структурой совокупности генеральной (см.) по одному или нескольким контролируемым признакам. Контролируемыми могут быть любые признаки, инвариантные задачам исследования, генеральные распределения которых известны.

Социолог самое пристальное внимание должен уделять анализу возможностей возникновения ошибок смещения в выборочных социологических исследованиях.

Лекция 7.
Выборочный метод в социологическом исследовании (продолжение)

План:

1) Виды выборочного метода

2) Методы вероятностной выборки

Виды выборочного метода

Итак, суть выборочного метода заключается в том, что по определенным — довольно строгим — правилам из генеральной совокупности отбирается выборочная совокупность.

Выделяют две основных группы выборочных методов.

Вероятностная выборка — это такая выборка, для которой каждый элемент генеральной совокупности имеет определенную, заранее заданную вероятность быть отобранным. Это позволяет исследователю рассчитать, насколько правильно выборка отражает популяцию, из которой она спроектирована. (Такую выборку называют еще случайной.)

Неслучайная (или невероятностная) выборка это такой способ отбора единиц, при котором мы не можем заранее рассчитать вероятность каждого элемента попасть в состав выборочной совокупности, что, разумеется, не дает возможности рассчитать, насколько правильна (репрезентативна) выборка.

Методы вероятностной выборки

Главное условие осуществления вероятностной выборки — наличие полного списка всех элементов генеральной совокупности от 1 до N, где N — общее число всех элементов (отсутствие или недоступность такого списка чаще всего и препятствует ее реализации).

1. Простой случайный отбор

Выделяются два основных метода простого случайного отбора: это метод жребия (или лотерейный метод) и метод таблиц случайных чисел.

При использовании (метода жребия (или лотерейный метода) жетоны с номерами всех элементов помещают в урну, тщательно перемешивают и извлекают последовательно n жетонов, где n — число элементов выборочной совокупности.

Выделяются две процедуры выполнения этого метода: простой случайный повторный отбор (жетоны после выбора возвращаются на место) и простой случайный бесповторный отбор (жетоны не возвращаются).

При формировании равновероятностной выборки из больших совокупностей пользуются также таблицами случайных чисел. Начинать процесс выбора случайных чисел можно с любого места таблицы и вести его в любом направлении (по строкам, столбцам и т. п.) или выбирая только определенные столбцы. Если имеющиеся под рукой таблицы достаточно длинны, то при решении очередной задачи выбора рекомендуется начинать с нового места таблицы.

2. Метод систематической или механической выборки

На практике чаще всего используют метод систематической (или механической) выборки, когда из пронумерованного списка через равные интервалы k отбирается заданное число респондентов. При этом шаг выборки k рассчитывается по простой формуле:

где N — численность генеральной совокупности, n — численность

1. Метод серийной выборки (гнездовая - по )

(По – это невероятностная выборка – гнездовая или кластерная)

При серийной выборке единицы отбора представляют собой статистические серии, т. е. совокупности статистически различимых единиц. В качестве таких единиц могут выступать семья, бригада, школьный класс, небольшие производственные коллективы в учреждениях, почтовые отделения, врачебные участки, населенные пункты, территориальные общности и т. п. Отобранные в выборку серии подвергаются сплошному или выбо

3. Метод стратифицированной выборки

Вероятностная выборка с любой техникой отбора {простая случайная, систематическая, серийная или многоступенчатая) становится стратифицированной, если процедурам отбора предшествует выделение в генеральной совокупности однородных частей, называемых стратами.

Стратификация совокупности оказывается необходимой во всех случаях, когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.

Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или нескольким признакам.

При построении выборки математическая статистика рекомендует, чтобы размеры выборки из каждой страты были пропорциональны средним квадратическнм отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии, как правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорционально их размеру (доле) в общей численности совокупности.

где ni – представительность страты в выборке, Ni – размер страты, n – установленный размер выборки; N – генеральная совокупность

Весь объем выборки равен

, где l – количество групп

Лекция 8.
Выборочный метод в социологическом исследовании (продолжение)

План:

1) Методы невероятностной выборки

2) Многоступенчатая выборка

Методы невероятностной выборки

Невероятностная (или неслучайная) выборка — это такой способ отбора единиц выборочной совокупности, принцип которого отличен от случайного. Как и для вероятностного способа отбора, основная цель неслучайного отбора состоит в получении совокупности, репрезентирующей изучаемый объект. Однако, в отличие от вероятностной выборки, статистические выводы обо всем множестве объектов в этом случае делать не совсем правомерно. Выделяют два основных вида неслучайного отбора: направленный отбор (другие названия — целенаправленный, целевой, выбор по усмотрению) и стихийный. Наиболее распространенными формами направленного отбора считаются: выбор типичных представителей, квотная выборка, метод снежного кома (У здесь гнездовая выборка), у – просто «целевая выборка».

1. Целевая выборка

По Ядову, целевая выборка – это такая, когда исследователь выборочную совокупность формирует произвольно, исходя из задач исследования. Часто такая выборка нужна при экспериментальном исследованиии.

2. Выбор типичных представителей

Среди объектов генеральной совокупности выбирается такие, которые имеют среднестатистические характеристики (обычно социально-демографические), и они выступают в качестве единиц наблюдения.

3. Квотная выборка

Квотная выборка представляет собою своеобразную микромодель генеральной совокупности, которая создается на основе определенных заданных параметров объекта (чаще всего — социально - демографических), которые берутся из статистических справочников.

Степень репрезентативности квотной выборки повышается прямо пропорционально степени устойчивости значений тех характеристик, по которым задаются квоты, поэтому признаки, изменяющие свои значения слишком быстро, здесь стараются не применять.

4. Метод снежного кома

Разновидностью целенаправленной выборки является метод снежного кома. Он обычно применяется для отбора экспертов и редко встречающихся групп pecпондентов (т. н. «редких элементов») — например потребителей, обладающих очень высокими доходами или представителей элитных групп. По сути, это техника поиска и отбора респондентов с определенным сочетанием свойств в таких условиях, когда трудно очертить границы генеральной совокупности. Особенность метода состоит в том, что, за исключением первого шага, выбор каждого очередного респондента совершается по указанию респондентов, включенных в выборку на предыдущем шаге. Каждый респондент указывает интервьюеру, где можно найти интересующих его людей (и даже сам связывается с ними и рекомендует интервьюера), и выборка с разрастается, подобно снежному кому.

5. Стихийная выборка

Стихийные выборки формируются произвольно и часто независимо от самого исследователя. Примерами стихийного отбора могут служить опросы с помощью средств массовой информации, выборка «первого встречного», опросы покупателей в залах супермаркетов, пассажиров на остановках и в общественном транспорте и т. д. Исследователь здесь имеет дело с максимально доступными для него единицами наблюдения и исходит по преимуществу только из критерия принадлежности респондента к проектируемой генеральной совокупности. Чаще всего в данном случае допускаются неконтролируемые систематические ошибки.

Многоступенчатая выборка

Отметим, что в реальной практике чаще всего применяется многоступенчатая выборка построенная с применением процедуры поэтапного отбора объектов опроса. При этом совокупность объектов, отобранных на предыдущем этапе (ступени), становится исходной для отбора на следующем. Промежуточные объекты, составляющие выборочную совокупность на высших ступенях, называют единицами отбора. Соответственно различают единицы отбора первой ступени (первичные единицы), единицы отбора вторичной ступени (вторичные единицы) и т. д. Объекты самой нижней ступени, с которых ведется непосредственный сбор информации, называются единицами наблюдения.

Лекция 9.
Выборочный метод в социологическом исследовании (продолжение)

План:

1) Ошибка выборки

2) Размеры выборки.

3) Стратегии расчета объема выборки:

Ошибка выборки.

Исходным пунктом расчета выборки становится вопрос об определении размеров выборочной совокупности. Численность выборочной совокупности зависит от двух факторов: (1) стоимости сбора информации и (2) стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь. Чем больше величина выборки, тем меньше возможная ошибка, но тем больше стоимость сбора информации.

Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри генеральной совокупности, которую мы исследуем. Чем больше различия (или гетерогенность) внутри генеральной совокупности, тем больше величина возможной ошибки выборки.

Предположим, N – генеральная совокупность, обладает среднестатистической характеристикой m. Это может быть средний возраст, доход, доля консерваторов и количество испытывающих счастье. Предположим далее, что из генеральной совокупности m отобрана совокупность п – выборочная, которая обладает средней характеристикой `x. Ясно, что п < N. Тогда задача заключается в сопоставлении m и `x. Отклонение выборочной средней от генеральной средней называется ошибкой выборки:


В данном случае ошибка выборки выступает как ошибка конкретной уже сделанной выборки. Когда ошибка выборки считается априори, то в таких случаях с помощью D обычно обозначают предельную ошибку выборки, т. е. наибольшее возможное отличие выборочной средней от генеральной (когда в выборку случайным образом попадают значения, наиболее отличающиеся от среднего генерального). Средняя ошибка выборки – это среднее ошибок всех возможных выборок.

Средняя ошибка с предельной связана формулой: D = Z * M, где

. Величина Z показывает, в каком отношении находится средняя ошибка выборки к одному среднему квадратическому отклонению. При Z = 1 отклонение выборочной средней от генеральной равно одной «сигме». Определить этот коэффициент Z можно по таблице, задавшись этой вероятностью.

Доверительная вероятность - это заданная априори необходимая степень точности выводов Доверительная вероятность показывает, что для изучаемого признака отклонения генеральной средней от выборочной не превысят предельной ошибкой выборки.

Это утверждение можно записать следующим образом:

или можно записать после преобразования:

Смысл приведенного соотношения следующий: с доверительной вероятностью (1 — a) можно утверждать, что генеральное среднее лежит в интервале , который и называется доверительным интервалом, а определяет как бы степень доверия к данным, получаемым по рассчитанным с ею помощью выборочным характеристикам. Т. е. доверительный интервалэто интервал, в котором колеблется генеральное среднее относительно выборочной средней с определенной доверительной вероятностью.

Практически ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В качестве контрольных параметров обычно применяются социально-демографические признаки.

перечисляет следующие требования к ошибке выборки:

1) повышенная надежность результатов – 3%;

2) обычная надежность – от3 до 10)%, наиболее часто применяется ошибка в 5%;

3) приближенная надежность – от 10 до 20%;

4) ориентировочная – от 20 до 40%;

5) прикидочная – более 40%.

Размеры выборки.

Определение объема выборки зависит от объема генеральной совокупности, от уровня однородности или разнородности изучаемых объектов и от уровня доверительного интервала допустимой статистической ошибки. приводит следующие расчеты репрезентативной выборки с допущением 5-процентной ошибки.

Размеры выборки для различных генеральных совокупностей

Объем генеральной совок-ти

500

1000

2000

3000

4000

5000

10000

100000

Объем выборки

222

286

333

350

360

370

385

398

400

Зависимость численности сравниваемых групп от значимости различий при Р=0,954, %

Численность сравниваемых групп

50

100

150

200

300

500

1000

5000

Значимые различия

20

14

11,5

10

8

6,3

4,5

2

Если размеры подвыборок неодинаковы, то за базу определения ошибки берется наименьшая подвыборка.

Таблица определения числа наблюдений по данной величине
доверительной вероятности Р и данной допускаемой ошибке m

Р

m

0,1

0,09

0,08

0,07

0,06

0,05

0,04

0,03

0,02

0,01

0,75

33

40

51

67

51

132

206

367

827

3308

0,8

41

50

64

83

114

164

256

456

1026

4105

0,85

51

63

80

105

143

207

323

575

1295

5180

0,9

67

83

105

138

187

270

422

751

1690

6763

0,91

71

88

112

146

199

287

449

798

1736

7185

0,92

76

94

119

156

212

306

478

851

1915

7662

0,93

82

101

128

167

227

328

512

911

2051

8207

0,94

88

109

138

180

245

353

552

982

2210

8843

0,95

96

118

150

195

266

384

600

1067

2400

9603

0,96

105

130

164

215

292

421

659

1171

2636

10544

0,965

111

137

173

226

308

444

694

1234

2778

11112

0,97

117

145

183

240

327

470

735

1308

2943

11773

0,975

125

155

196

256

348

502

784

1395

3139

12559

0,98

135

167

211

276

375

541

845

1503

3382

13529

0,985

147

182

231

301

410

591

924

1643

3697

14791

0,99

165

204

259

338

460

663

1036

1843

4146

16587

0,991

170

210

266

348

473

682

1066

1895

4264

17057

0,992

175

217

274

358

488

703

1098

1953

4395

17583

0,993

181

224

284

371

505

727

1136

2020

4545

18182

0,994

188

233

294

385

524

755

1179

2097

4718

18875

0,995

196

243

307

402

547

787

1231

2188

4924

19698

0,996

207

255

323

422

575

828

1294

2301

5177

20709

0,997

220

271

344

449

611

880

1376

2446

5504

22018

0,998

238

294

373

487

663

954

1492

2652

5968

23873

0,999

278

334

422

552

751

1082

1691

3007

6767

27069

Стратегии расчета объема выборки:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17