Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Таблица 10.19

Влажность х, %

Прочность у, дан

Средняя прочность

36

38

40

58

70

80

82

93

2,0

2,4

2,3

2,8

3,0

3,1

3,2

2,9

2,1

2,6

2,4

2,9

3,1

3,3

3,2

2,9

2,1

2,5

2,2

3,0

3,1

3,1

3,2

3,0

1,9

2,5

2,4

2,6

3,2

3,1

3,0

3,1

2,0

2,4

2,3

2,7

3,1

3,1

3,2

3,0

1,9

2,6

2,3

2,8

3,1

2,9

3,2

3,1

2,0

2,5

2,3

2,8

3,1

3,1

3,2

3,0

Для каждого значения х вычислены средние значения , которые записаны в последнем столбце таблицы. Требуется найти эмпирическую формулу, выражающую приближенную зависимость между х и .

На рис. 10.26 нанесены точки, ординатами которых служат средние значения .

Рис. 10.26

Как видим, точки довольно точно располагаются вблизи некоторой прямой, особенно если учесть разные масштабы по осям координат. Следовательно, эмпирическую формулу ищем в виде

Коэффициенты а и b определим методом наименьших квадратов, причем так как для каждого из k = 8 значений х делалось одинаковое тx = 6 число испытаний у, используем формулы (10.28) и (10.29). Для вычисления величин, входящих в эти формулы, составим вспомогательную таблицу (табл. 10.20).

Таблица 10.20

х

х2

х

36

38

40

58

70

80

82

93

2,0

2,5

2,3

2,8

3,1

3,1

3,2

3,0

1296

1444

1600

3364

4900

6400

6724

9649

72,0

95,0

92,0

162,4

217,0

248,0

262,4

279,0

497

22,0

34377

1427,8

В результате получаем:

Искомая эмпирическая формула, выражающая приближенную зависимость прочности от влажности, будет выглядеть так:

НЕ нашли? Не то? Что вы ищете?

у = 0,018х + 1,67

Надо заметить, что зачастую неверно считают, что метод наименьших квадратов дает более точные эмпирические формулы, чем метод средних или метод выровненных точек. Но не следует забывать, что неточность, если можно так сказать, формулы является прежде всего результатом рассеяния экспериментального материала и никакой «точный» метод не может компенсировать это рассеяние.

Метод наименьших квадратов применим и в случае нахождения эмпирической формулы в виде квадратической зависимости (10.13).

11. СРАВНЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК
ПО ВЫБОРОЧНЫМ ДАННЫМ

11.1. Понятие о статических гипотезах и критериях оценки

При обработке экспериментальных данных (измерений) возникает часто задача определения значимости различия между числовыми характеристиками и , т. е. между генеральными средними и , дисперсиями и , коэффициентами вариации и и др. Это бывает в следующих случаях:

1)  при оценке влияния измерений уровня фактора (в каком-либо процессе) на выходной параметр. Например, будет ли значимая разница в прочности пряжи при изменении коэффициента крутки на 10 единиц (130 вместо 120) или в плотности ткани по утку при увеличении заправочного натяжения основы на 10%, или в плотности трикотажа (по вертикали) при увеличении глубины кулирования на 0,5 мм;

2)  при сравнении свойств двух партий сырья или готовой продукции, полученной из этого сырья. Например, будет ли значимая разница между двумя марками хлопка одного сорта, полученного фабрикой в разное время года;

3)  при сравнении двух систем прядения, технологических процессов или объектов. Например, будет ли разница по чистоте и степени разъединенности волокон в ватке-прочесе, полученной на двух различного типа кардочесальных машинах;

4)  при сравнении разного состава или структуры продуктов производства;

5)  при определении воспроизводимости и стационарности процесса;

6)  при сравнении двух методов исследования свойств продукта или работы машины.

Такие задачи могут быть решены только на основе анализа статических данных и проверки статических гипотез.

Различают два вида статических гипотез: предположение о числовых характеристиках (параметрах) генеральной совокупности (в том случае, если известен тип распределения генеральной совокупности) и предположение о типе распределения (в том случае, если об изучаемой переменной ничего неизвестно).

На практике чаще всего встречается первый вид статических гипотез, т. е. так называемая нулевая гипотеза - Но, например «О равенстве числовых характеристик и » для рассматриваемых двух любых выборок вместо конкурирующей (альтернативной) гипотезы Н1 «О неравенстве этих характеристик ».

Поскольку при проверке гипотез речь идет об оценках генеральных совокупностях на основе случайных выборок, то выводы будут носить вероятностный характер.

Из математической статистики известны две группы критериев проверки нулевой гипотезы Но – параметрические и непараметрические.

Первая группа критериев в качестве необходимого условия их применимости требует, в частности, независимости рядов измерений выходного параметра и распределения этих рядов по нормальному закону. При выполнении этих условий мощность параметрических критериев достаточно высока; по мере отступления от них она снижается. Другими словами, невыполнение необходимых условий влечет за собой увеличение вероятности принятия нулевой гипотезы Но в качестве истинной, хотя в действительности она является ложной.

Вторая группа критериев, обладая меньшей мощностью по сравнению с первой, не налагает на ряды измерений никаких необходимых условий, их вычисления проще. Это объясняет предпочтительность практического применения критериев второй группы, а в некоторых случаях делает его единственно возможным.

Искомый параметрический критерий проще всего получить, если предположить, что проверяемая гипотеза Но верна, т. е. рассматриваемая случайная величина x действительно распределена по закону, задаваемому функцией f(x), и рассмотреть область, в которой оказалось значение величины x. Пусть x попало в область, расположенную вблизи правого (рис. 11.1, а) или левого (рис. 11.1, б) хвоста функции f(x), и, следовательно, вероятность попадания случайной величины в эту область, вычисленная при помощи функции f(x), практически равна или близка к нулю. В этой ситуации целесообразно принять ошибочность гипотезы Но. Если значение x оказалось в интервале, достаточно удаленном от обоих хвостов функции f(x), то целесообразно считать, что гипотеза Но может быть принята.

Искомый критерий оценки соответствия анализируемой гипотезы Но опыту можно получить, если этим качественным рассуждениям придать количественный характер. Вероятность попадания случайной величины x в критическую область (заштрихованная часть на рис. 11.1, а) называют уровнем значимости. Он равен

Если x > xкр для выбранного уровня значимости a, то x попадает в критическую область функции распределения f(x) и гипотеза Но должна быть отброшена. Если x < xкр , то x вне критической области и гипотеза Но может быть принята. Однако утверждать правильность гипотезы нельзя,

Рис. 11.1. Критические области дифференциального закона распределения для одностороннего и двустороннего критерия принятия гипотезы

можно лишь сказать, что на основе проведенных измерений гипотеза не является неправильной (может оказаться, что после оценки какой-то большой выборки гипотеза окажется неправильной). Область допустимых значений с уменьшением уровня значимости увеличивается.

Если критическая область целиком расположена в правой (или в левой) части графика f(x), то критерий называется односторонним. Этот критерий используется, когда заранее имеются веские основания для утверждения, что попадание случайной величины в противоположную область функции распределения или невозможно, или не имеет практического значения. Если у исследователя заранее нет оснований для подобного предположения, критическую область необходимо рассматривать состоящей из двух частей.

В этом случае уровень значимости критерия a численно равен сумме заштрихованных на рис. 11.1, в площадей, а соответствующий критерий называется двусторонним.

Следовательно, осуществляя проверку гипотезы, можно допустить две взаимосвязанные ошибки: отвергнуть правильную гипотезу (ошибка первого рода); принять неправильную гипотезу (ошибки второго рода).

Вероятность допустить ошибку первого рода равна уровню значимости a. Вероятность ошибки второго рода обозначается b, а величина 1-b называется мощностью критерия. С уменьшением a увеличивается значение b, и наоборот.

Одновременное уменьшение вероятностей ошибок первого и второго рода возможно только при увеличении объема выборок. Для выбранного уровня значимости a критическую область целесообразно выбирать так, чтобы мощность критерия была максимальной и тем самым достигалась максимальная ошибка второго рода.

Компромисс между вероятностями – отвергнуть верную гипотезу и неверную – обеспечивается, если при выборе уровня значимости руководствоваться определенными рекомендациями, выработанными практикой применения теории проверки статических гипотез.

Принятие гипотезы. Если проверяемая гипотеза принимается с 5%-ным или более высоким уровнем значимости, то ее, безусловно, следует признать согласующейся с экспериментальным данными. Если проверяемая гипотеза может быть принята с уровнем значимости, меньшим 5%-ного, но больше 1%-ного, то можно либо пойти на риск принятой гипотезы, либо взять гипотезу под сомнение.

В такой ситуации целесообразно провести повторный эксперимент для получения данных, на основании которых можно было бы сделать более определенные выводы. Применения критерия с более низким, чем 1%-ный, уровнем значимости для принятия гипотезы следует избегать.

Отбрасывание гипотезы. Если гипотеза отвергается с 1%-ным или более низким уровнем значимости, то ее, безусловно, следует признать не согласующейся с экспериментальными данными. Если подвергаемая гипотеза может быть отвергнута применением более высокого уровня значимости, лежащего между 1%-ным и 5%-ным значениями, то следует либо также отвергнуть, либо только поставить под сомнение. Однако в этой ситуации лучше повторить эксперимент вновь оценить выбранную гипотезу. Принятие 5%-ного или более высокого уровня значимости не дает основания для отбрасывания гипотезы.

Последовательность проверки гипотезы следующая:

1)  формулировка проверяемой, т. е. нуль-гипотезы Но, и конкурирующей (альтернативной) Н1 гипотез;

2)  выбор критерия или статической характеристики для проверки гипотезы Но и определение выборочного распределения критерия, когда допускается гипотеза Но;

3)  выбор уровня значимости a;

4)  определения критической области для проверки гипотезы Но;

5)  расчет критерия по данным выборки;

6)  сравнение расчетного критерия с табличным, который определяется критической областью.

При выборе параметрического критерия для проверки гипотезы Но необходимо прежде всего сопоставить оба ряда измерений между собой с целью определения соизмеримости их числовых статических характеристик. При этом возможны два случая: ряды равноточны и ряды неравноточны .

Для анализа статистических данных и проверки статистических гипотез применяются следующие критерии оценки:

·  Сравнение дисперсии свойств нового продукта со стандартной дисперсией – используется при введении нового метода исследования процесса или продукта, а также при получении продукта новой структуры или по новой технологии;

·  Сравнение двух дисперсий нормальных генеральных совокупностей – используется при сопоставлении различных технологических объектов по устойчивости их работы, при выборе метода измерения параметров процесса или свойств продукта, обладающего меньшей ошибкой, а также при определении значимости разности средних двух рядов измерений;

·  Непараметрический критерий для сравнения двух дисперсий – используется, если нам неизвестно о законе распределения двух исследуемых выборок и требуется провести сравнение их, дисперсий;

·  Сравнение нескольких дисперсий – используется для оценки воспроизводимости (устойчивости) работы одного объекта, или однородности дисперсий выходного параметра на разных объектах, или воспроизводимости методик измерения. Например, если получено N рядов измерений выходного параметра одним и тем же методом при работе одного и того же объекта, но при N разных уровнях фактора, или при измерении выходного параметра одним методом для N различных объектов, или при одинаковых условиях работы одного объекта N разными методами измерения выходного параметра;

·  Сравнение выборочной средней c теоретически предполагаемым средним или стандартным значением – используется, если необходимо сравнить среднее выборочное значение со стандартным;

·  Сравнение двух средних больших независимых выборок – используется если выборки имеют большой объем (m³30). Например, для определения существенности разницы между средними значениями прочности двух образцов пряжи, выработанных на прядильной машине до и после внесения конструктивных изменений;

·  Сравнение двух средних из нормально распределенных генеральных совокупностей – используется если проверяется гипотеза о равенстве двух средних из нормально распределенных генеральных совокупностей, дисперсии которых неизвестны;

·  Непараметрический критерий для сравнения двух средних – позволяет находить различия между двумя выборками при условии, что они отличаются своими средними;

·  Сравнение нескольких средних значений – используется для определения незначимости влияния различных технологических факторов (прядения, ткачества и вязания, конструктивных особенностей испытываемых машин, условий испытания и т. п.) на средние значения измерений свойств продуктов или параметров процесса;

·  Непараметрический критерий для сравнения нескольких средних –применяется в тех случаях, когда выборки имеют любое распределение и одинаковый объем измерений;

·  Сравнение двух коэффициентов вариации – используется для решения задачи о значимости различия коэффициентов вариации для двух независимых выборок измерений.

11.2. Сравнение дисперсии свойств нового продукта
со стандартной дисперсией

При введении нового метода исследования процесса или продукта, а также при получении продукта новой структуры или по новой технологии исследователь должен установить соответствие генеральной дисперсии σ2 ряда полученных измерений со стандартной дисперсией , которая известна по теоретическим или предшествующим экспериментальным исследованиям.

Проверка нулевой гипотезы Но: σ2 = M{S2} = при конкурирующей гипотезе Н1: σ2 = M{S2} > состоит в том, что рассчитывают случайную величину

(11.1)

Последняя имеет хи-квадрат (χ2) распределение с (m-1) степенями свободы. Расчетное значение критерия сопоставляют с односторонним табличным (критическим) значением критерия для заданного уровня значимости a. Если < [a; f = m–1], то считается, что полученный результат не противоречит гипотезе Но (дисперсия какого-либо свойства продукта, полученного по новой технологии, значимо не отличается от стандартной дисперсии); в противном случае нулевая гипотеза отвергается.

Проверка нулевой гипотезы Но: σ2 = M{S2} = при конкурирующей гипотезе Н1: σ2 = M{S2} ≠ также осуществляется с помощью критерия , расчетное значение которого определяется по формуле (11.1). В этом случае критическая область будет двусторонней, т. е. вероятность выхода за верхнюю и нижнюю критические границы одинакова.

Нулевая гипотеза не отвергается, если удовлетворяется одно из неравенств:

,

В противном случае нулевая гипотеза отвергается.

11.3. Сравнение двух дисперсий
нормальных генеральных совокупностей

Сравнение дисперсий исследователь проводит при сопоставлении различных технологических объектов по устойчивости (воспроизводимости) их работы, при выборе метода измерения параметров процесса или свойств продукта, обладающего меньшей ошибкой. Сравнение дисперсий проводится также при определении значимости разности средних двух рядов измерений.

Пусть и являются оценкой одной и той же нормальной генеральной дисперсии. Требует проверить гипотезу Но: = по отношению к трем конкурирующим гипотезам Н1: ; Н2: > ; Н3: < . Чаще всего встречается конкурирующая гипотеза Н2.

Так как случайные величины Y1 и Y2 распределены по нормальному закону, то в качестве критерия сравнения двух дисперсий принимается частное оценок дисперсии генеральной совокупности

где в числителе – большая из двух оценок рассеяния (для того чтобы значение F всегда было больше единицы).

Доказано, что отношение дисперсий как статистическая характеристика при верной гипотезе Но имеет распределение Фишера с (m1-1) и (m2-1) степенями свободы. Критическая область для проверяемой гипотезы при уровне значимости a является односторонней.

Расчетное значение критерия Фишера, определяемое по формуле

(11.2)

сравнивается с табличным критерием Фишера FT, определяемым при известных значениях a, , . Если FR < FT [1-a; ], то гипотеза о равенстве дисперсий не отвергается, т. е. два ряда измерений являются равнозначными. Если FR > FT, то гипотеза Но отвергается и с доверительной вероятностью pD = 0,95 можно утверждать, что > , т. е. два полученных ряда измерений являются неравнозначными.

В случае, когда альтернативной гипотезой по отношению к нулевой является Н1: , проверяемая гипотеза Н0: = не отвергается, если выполняется неравенство

FR < FT [a/2; ],

т. е. принимается двусторонняя критическая область при условии, что нулевая гипотеза справедлива и вероятность попадания критерия в каждый из двух интервалов критической области равна a/2 (вдвое меньше заданного).

Пример 11.1. Пусть выходной параметр объекта при одном уровне фактора характеризуется дисперсией с числом степеней свободы f1 = 2 (число измерений 3); для второго уровня соответственно ; f2 = 12. Оцениваем возможность гипотезы Но: = .

При альтернативной гипотезе Н1: > и доверительной вероятности pD = 0,95 по приложению 4 находим FT [pD = 0,95; f1 = 2; f2 = 12] = 3,885.

Так как , то выдвинутую гипотезу об однородности (воспроизводимости) дисперсии или равноточности двух рядов измерений Y1 и Y2, безусловно, надо принять.

Пример 11.2.

Пусть для двух рядов измерений выборочные дисперсии равны и с числом степеней свободы f1 = f2 = 5 (число измерений 6). Требуется дать оценку гипотезе H0: = при конкурирующей гипотезе Н1 : > приняв уровень значимости α = 0,05 или pD = 0,95.

Табличное значение критерия Фишера находим из приложения 4: FT [pD =0,95; f1 = 5; f2 = = 5] = 5,05. Так как FR = 20,2/1,8 = 11,5 > FT = 5,05, то с 5%-ным уровнем значимости проверяемая гипотеза принята быть не может.

Оценим теперь возможность отбрасывания гипотезы. Для этого налагаем уровень значимости α = 0,01 или pD = 0,99 и по приложению 4 находим табличное значение критерия Фишера: FT [pD =0,99; f1 = 5; f2 = 5] = 10,97. Так как FR = 11,5 > FT = 10,97, то оцениваемая гипотеза Н0 должна быть отброшена с 1%-ным уровнем значимости.

Таким образом, статистическая оценка гипотезы = по экспериментальным значениям выборочных дисперсий и показывает, что в рассматриваемом случае проверяемая гипотеза уверенно может быть отвергнута, т. е. дисперсии и следует признать неоднородными.

Пример 11.3.

Пусть для двух рядов измерений выходного параметра при двух уровнях фактора получены следующие выборочные дисперсии: с числом степеней свободы f1 = 10 и с f2 = 5. Требуется дать оценку гипотезы Но: = при конкурирующей гипотезе Н1: >

Оцениваем вначале возможность принятия гипотезы. Для этого принимаем уровень значимости α = 0,05 и по приложению 4 находим: FT [pD =0,95; f1 = 10; f2 = 5] = 4,735. Так как FR = 10/2 = 5 > FT = 4,735, то с 5%-ным уровнем значимости гипотеза принята быть не может.

Оценим теперь возможность отбрасывания гипотезы. Для этого находим по приложению 4 при α = 0,01 табличное значение критерия Фишера: FT [pD =0,99; f1 = 10; f2 = 5] = 10,05. Так как FR= 5 < FT= 10,05, то 1%-ный уровень значимости не позволяет отбросить оцениваемую гипотезу, т.. е., следовательно, проверяемая гипотеза с уверенностью не может быть ни принята, ни отброшена. При α = 0,025 имеем FR = 5 < FT [pD =0,975; f1 = 10; f2 = 5] = 6,619, и, следовательно, оцениваемая гипотеза может быть принята с 2,5%-ным уровнем значимости.

В данной ситуации можно пойти на риск принятия гипотезы. Однако наиболее целесообразным следует считать проведение повторного эксперимента для более уверенного заключения относительно проверяемой гипотезы.

11.4. Непараметрический критерий для сравнения двух дисперсий

Если исследователю неизвестно о законе распределения двух исследуемых выборок и требуется провести сравнение их, дисперсий, применяется непараметрический критерий (Сиджели-Тьюки). Этот критерий базируется на применении чисел рангов вариационного ряда, образованного из двух исходных независимых выборок. При этом в качестве нулевой гипотезы Н0 принимаем = и конкурирующей Н1: . При использовании указанного критерия исследователь проводит следующие операции:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30