Эти числа и дадут нам номера тех предметов из 100, которые нужно считать отобранными наудачу.
Отобранные таким образом предметы составляют случайную выборку без повторения объема 20 из нашей генеральной совокупности объема 100.
Изучив эти 20 предметов, мы изучим свойства произведенной выборки и по ним можем судить с некоторым приближением о свойствах генеральной совокупности.
11
Часто объем генеральной совокупности (если он велик) определяют ориентировочно. Например, если осуществляется случайная выборка полуметровых образцов пряжи с початка, то генеральный объем (общее число образцов) может быть получен как частное от деления приблизительной длины всей пряжи в початке (в метрах) на 0,5.
Применение нумерованных билетов для жеребьевки или таблицы случайных чисел требует предварительной нумерации всех объектов генеральной совокупности, что далеко не всегда осуществимо. Например, в одной кипе хлопка весом 200 кг число волокон (объектов) составляет около 40 млрд. Поэтому при очень большом числе объектов в генеральной совокупности перед отбором прибегают к интенсивному перемешиванию объектов, что обеспечивает потом одинаковую вероятность попадания их во взятую наугад выборку из нескольких объектов.
При случайном отборе выборок не следует забывать о периодических изменениях качества материала. Например, неправильно отбирать выборку чесальной ленты всегда после очесывания машины, так как в это время лента имеет повышенный номер и лучшую чистоту. Испытание только внешнего слоя полностью намотанных паковок не учитывает изменения свойств нити внутри паковок.
Механический одностепенный метод основан на нумерации всех объектов генеральной совокупности и отборе их через определенный интервал. Например, в выборку берут 5, 10, 15, 20-й объекты и т. д. Этот метод практически не применим, если число объектов в генеральной совокупности велико, но его можно использовать, например, для отбора нескольких паковок из одного ящика.
Двухстепенные методы отбора предусматривают предварительное деление генеральной совокупности на отдельные, примерно равные части и отражение этого деления в выборке, а также при записи результатов испытаний. При испытании текстильных материалов такие методы отбора применяют очень часто, поскольку партии большинства материалов состоят из отдельных частей.
Так, партия сырья обычно состоит из кип, партия пряжи — из отдельных паковок, партия ткани — из нескольких кусков и т. д.
Если партия материала разделена на части, но отобранные из разных ее частей объекты объединены в одну выборку, то такая выборка является одностепенной.
Из двухстепенных методов отбора на практике применяют: типический, комбинированный, механический и серийный.
Типический отбор производится из генеральной совокупности, разбитой на ряд серий разного объема. Отдельные объекты выбирают из каждой серии случайным методом в количестве:
- не пропорциональном объему отдельных серий,
12
- пропорциональном объему отдельных серий,
- пропорциональном произведению численности отдельных серий на внутрисерийный коэффициент вариации.
Из трех перечисленных вариантов отбора наиболее выгодный 3-й вариант, который дает наименьшую ошибку выборки, затем 2-й и, наконец, 1-й вариант. Однако при исследовании текстильных материалов методы типического отбора проб обычно не используют.
Комбинированный метод применяют, когда генеральная совокупность разделена на одинаковые части — серии. Пробу составляют из нескольких случайно выбранных серий, которые исследуют не полностью, а частично. Этот метод отбора особенно часто применяют при испытании нитей, когда каждая паковка является серией. При комбинированном методе отбора наименьшую ошибку выборки получают при проведении одного испытания с паковки и при максимально возможном числе паковок в выборке.
При механическом отборе генеральную совокупность разделяют на равные серии и из каждой выбирают случайным методом по одному объекту или проводят по одному испытанию. Механический отбор выгодно применять, когда совокупность разнородна по сериям и однородна внутри серии; последнее можно установить по предварительным испытаниям, используя другой метод отбора, например комбинированный.
Серийный метод предусматривает разбивку генеральной совокупности на одинаковые серии и случайную выборку нескольких из них. Серии, попавшие в выборку, исследуют полностью. Серийный отбор выгодно применять, когда совокупность однородна по сериям и неравномерна внутри серий. Поскольку отдельные реально существующие серии текстильных материалов очень многочисленны (кипы волокна, паковки пряжи и т. п.), этот метод на практике используют редко, так как полное испытание даже одной серии требует очень много времени.
Многостепенной метод отбора применяют обычно в виде трехстепенного, который предусматривает разбивку генеральной совокупности на равные группы, подразделяемые на серии, состоящие из одинакового количе-ства объектов. Его используют при техническом контроле качества продукции на отдельных паковках, вырабатываемой несколькими машинами или, например, при оценке качества пряжи на паковках, уложенных в несколько ящиков.
2 Обработка результатов предварительного эксперимента
Первичная обработка экспериментальных данных включает:
- определение основных статистических характеристик случайных величин: среднего, дисперсии или среднего квадратического отклонения, коэффициента вариации и вида распределения случайных величин, а также определение точности и надежности этих характеристик;
13
- исключение резко выделяющихся (выскакивающих, аномальных) экспериментальных данных;
- статистическую проверку случайности и независимости результатов измерений (испытаний);
- проверку воспроизводимости процесса;
- проверку стационарности процесса и определение скрытых периодичностей и наличия дрейфа (тренда) экспериментальных данных.
2.1 Определение основных статистических характеристик
Полной характеристикой случайных величин, получаемых при измерении свойств продуктов и параметров процессов текстильной промышленности, является функция (закон) распределения.
К основным числовым характеристикам случайных величин относятся: среднее значение, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Среднее значение определяет центр распределения случайных величин, около которого группируется большая их часть. Этот центр распределения характеризуется средней арифметической, медианой, модой, средней геометрической и средней гармонической. В практике обработки результатов эксперимента при исследовании свойств продуктов или параметров технологических процессов текстильной промышленности чаще всего используется среднее арифметическое значение выборочных данных, которое определяется по данным эксперимента по формуле (1).
| (1) |
где m – число испытаний (повторностей);
Y1(Х), Y2(Х), Y3(Х),…, Yi(Х),…, Ym(Х), - элементы выборки (результаты испытаний образцов) в количестве m штук.
Эта характеристика является оценкой истинного (генерального) среднего значения, определяемого по генеральной совокупности.
Абсолютной характеристикой рассеяния случайной величины около центра распределения является дисперсия – S2(Y). Она вычисляется по следующей формуле (2).
| (2) |
Сущность значений среднего и дисперсии поясняется на рис. 3.
14

Рис. 3. Нормальная кривая распределения
Другой абсолютной характеристикой рассеяния случайной величины около центра распределения является среднее квадратическое отклонение (СКО) – S(Y). По этой характеристики часто можно судит о величине ошибки эксперимента. СКО вычисляется по выражению (3).
| (3) |
Коэффициент вариации является относительной характеристикой рассеяния случайной величины. Этот показатель характеризует разброс значений относительно среднего значения и вычисляется по выражению (4).
| (4) |
Если эта величина выражается в процентах, то она называется квадратической неровнотой (5).
| (5) |
15
2.2 Исключение резко выделяющихся экспериментальных данных
Как было отмечено выше, грубые ошибки можно исправить или исключить из дальнейшей обработки. Это необходимо делать, с одной стороны, поскольку присутствие резко максимальных или резко минимальных по отношению к другим числовым данным значений резко смещает значение среднего и других статистических характеристик в большую или меньшую сторону. С другой стороны, эти характеристики искажаются при необоснованном исключении резко выделяющихся данных.
Так как совокупность полученных экспериментальных данных часто имеет значения, резко выделяющиеся относительно других, это приводит к постановке вопроса об их исключении из дальнейшей обработки.
Первый и самый надежный метод определения возможности исключения резко выделяющихся данных — это анализ условий, при которых они были получены. Если условия существенно отличаются от стандартных или установленных по плану эксперимента, то данные необходимо исключить из дальнейшей обработки независимо от их величины.
Второй — статистический — метод применяется в том случае, когда определение существенности изменения условий эксперимента представляет большие трудности. Сущность статистического метода заключается в определении:
- среднего значения, дисперсии и среднего квадратического отклонения для полученных значений случайных величин, которые представляют выборку из нормальной генеральной совокупности;
- расчетного значения критерия Смирнова – Грабса по формулам:
при подозрении резко выделяющегося максимального значения
| (6) |
при подозрении резко выделяющегося минимального значения
| (7) |
Затем VRmax или VRmin сравнивают с табличным критическим значением критерия VT, который определяется по табл. 1 при условии, что доверительная вероятность pD или уровень значимости a=1 - РD и число измерений (число повторных опытов в матрице) m, т. е. VT [pD; m] или VT [а, т]. Если VRmax > VT или VRmin > VT, то резко выделяющиеся значения Yimax или Yi min исключают из дальнейшей статистической обработки данных.
16
Таблица 1. Критические значения Vт критерия исключения резко выделяющихся данных выборки
Повторность | Рд | ||
m | 0,99 | 0,95 | 0,9 |
3 | 1,414 | 1,412 | 1,406 |
4 | 1,723 | 1,689 | 1,645 |
5 | 1,955 | 1,869 | 1,791 |
6 | 2,13 | 1,996 | 1,894 |
7 | 2,265 | 2,093 | 1,974 |
8 | 2,374 | 2,172 | 2,041 |
9 | 2,464 | 2,237 | 2,097 |
10 | 2,54 | 2,294 | 2,146 |
11 | 2,606 | 2,343 | 2,19 |
12 | 2,663 | 2,387 | 2,229 |
13 | 2,714 | 2,426 | 2,264 |
14 | 2,759 | 2,461 | 2,297 |
15 | 2,8 | 2,493 | 2,326 |
16 | 2,837 | 2,523 | 2,354 |
17 | 2,871 | 2,551 | 2,38 |
18 | 2,903 | 2,577 | 2,404 |
19 | 2,932 | 2,6 | 2,426 |
20 | 2,959 | 2,623 | 2,447 |
21 | 2,984 | 2,644 | 2,467 |
22 | 3,008 | 2,664 | 2,486 |
23 | 3,03 | 2,683 | 2,504 |
24 | 3,051 | 2,701 | 2,502 |
25 | 3,071 | 2,717 | 2,537 |
Если полученная выборка значений параметра имеет более одного резко выделяющегося значения Y, то критерий V может быть применен поочередно к каждому из них в отдельности.
Пример. При испытании пряжи на разрыв были получены следующие значения ее прочности: 199; 239; 214; 229; 224; 234; 219; 300; 224; 218. Распределение значений прочности пряжи подчиняется нормальному закону.
|
|
|
17
По табл. 1 находим, что VТ [a=0.05; m=10]=2.29. Так как VRmax = 2.75 > VТ [a=0.05; m=10]=2.29, то значение Ymax = 300 необходимо исключить из дальнейшей обработки.
2.3 Доверительные интервалы статистических характеристик
В результате измерений параметров технологического процесса или свойств продукта возникают погрешности. Абсолютной погрешностью (ошибкой) измерения e называют разность между результатом измерения Yi и действительным значением Y0 измеряемой величины (8).
| (8) |
Относительной погрешностью (ошибкой) измерения d называют отношение абсолютной ошибки ei к результату измерения (9).
| (9) |
Погрешность появляется вследствие изменения параметров объекта во времени; ошибок оператора, связанных с уровнем его квалификации и психофизическим состоянием; инструментальных ошибок, вызываемых погрешностями изготовления приборов и датчиков; методических ошибок, связанных с методикой отбора образцов и измерений.
Для исследователя важно знать точность и надежность оценки каждого определяемого параметра. Представление о точности и надежности оценок параметров распределения дают доверительные интервалы. Для генеральной совокупности случайных величин выборочная оценка Т любого параметра 0 распределения есть случайная величина.
Двусторонним доверительным интервалом называют интервал от
до
, который покрывает неизвестный параметр распределения с заданной доверительной вероятностью РD.
Доверительной вероятностью РD (надежностью) называется вероятность того, что истинное значение числовых характеристик Q (особенно при m > 60) лежит в этом интервале, т. е. (10).
| (10) |
С увеличением доверительной вероятности РD увеличивается доверительная ошибка
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |









