Задача 6.

По выборочным данным 15 предприятий одной отрасли найдена средняя себестоимость единицы продукции. Она составила хв=4,85 руб. При этом исправленное среднее квадратическое отклонение Sx оказалось равным 0,94 руб. Аналогично была вычислена средняя себестоимость единицы продукции по 12 предприятиям той же отрасли, она составила в=5,07 руб., а Sy=1,02 руб. При уровне значимости 0,01 выявить существенность различия средней себестоимости единицы продукции на предприятиях, считая, что выборки извлечены из нормально распределенных генеральных совокупностей Х и Y.

Запишем условие задачи:

nx=15

в= 4,85 р

Sx = 0,94 р.

ny = 12

в= 5,07 р

Sy = 1,02 р

б = 0,01

Решение:

Признак Х – средняя себестоимость единицы продукции у предприятий первой группы

Признак У – средняя себестоимость единицы продукции у предприятий второй группы

Признаки имеют нормальный закон распределения.

Н0: М(Х)=М(Y)

Н1: М(Х)<М(Y)

Критическая область левосторонняя. Выбор критической области осуществляется исходя из вида конкурирующей гипотезы Н1. правосторонняя критическая область выбирается в том случае, если Н1:>; левосторонняя критическая область выбирается в том случае, если Н1:‹.

б = 0,01.

Возникает необходимость сравнения двух или большего числа средних значений. В таких случаях важно установить, является ли разница результатов статистически значимой. При рассмотрении этого вопроса сначала выясняют, насколько значима разница в дисперсиях сравниваемых значений. Проверку проводят с помощью F-критерия:

НЕ нашли? Не то? Что вы ищете?

F = , где S большая = 1,02, а S меньшая = 0,94. F = = = 1,1774

Так как о генеральных димперсиях ничего не известно, то с помощью случайной величины F, которая имеет распределение Фишера-Снедекора с k1 и k2 степенями свободы, предварительно проверим вспомогательную нулевую гипотезу:

Н0: D(X) = D(Y)

Н1: D(X) > D(Y)

Критическая область правостороняя. б = 0,01.

k1 = 12-1=11, k2 = 15-1 = 14

Находим значение по таблице «Критические точки распределения Фишера-Снедекора» при уровне значимости 0,01.

Fкрит (0,01; 11; 14) = 4,30

Вывод:  Сравниваем Fнабл и Fкрит (0,01; 11; 14). Так как Fнабл<Fкрит(0,01; 11; 14), то есть Fнабл попало в область принятия гипотезы, нет оснований отвергать нулевую гипотезу, по данным наблюдения D(Х)=D(Y), расхождение между исправленными выборочными дисперсиями (Sx2 и Sy2 ) случайное. Следовательно, можно проверить основную гипотезу.

Переходим к проверке основной гипотезы H0.

Предварительно выбираем конкурирующую гипотезу. В данном случае и х может быть

две:

1) Н1:М(Х)≠М(Y) (двусторонняя критическая область);

2) Н1 :М(Y)>М(X), так как x в< y в (правосторонняя критическая область).

Проверяем гипотезу Н0 в первом случае:

Н0: М(Х)=М(Y),

Н1: М(Х)≠М(Y).

Для проверки используется случайная величина.

Имеет распределение Стьюдента с k=nx+ny-2=15+12-2=25 степенями свободы.

Т = * = -0,582.

По таблице критических точек распределения Стьюдента находим tкрит. дв(0,01;25)=2,79 (при двусторонней критической области). Сравниваем Тнабл и tкрит. дв(0,01;25).Так как |Тнабл|<tкрит. дв(0,01;25), то есть Тнабл не попало в критическую область, нулевая гипотеза не отвергается, следовательно, расхождение между выборочными средними не значимо. Таким образом, средние себестоимости единицы продукции на предприятиях совпадают.

Проверим гипотезу Н0 во втором случае:

Н0: М(Х)=М(Y),

Н1: М(Х)>М(Y).

Так как Тнабл≈-0,582, tкрит. пр(0,01;25)=2,49 (при односторонней (правосторонней)

критической области), то |Тнабл|<tкрит. пр(0,01;25), то есть Тнабл не попало в критическую

область, вывод аналогичен предыдущему.

Задача 7.

Определить тесноту связи выпуска продукции Х (тыс. шт.) и себестоимость одного изделия Y (руб.) на основе следующих данных:

Х

2

3

4

5

6

Y

1,9

1,7

1,8

1,6

1,4

Проверить значимость выборочного коэффициента корреляции при уровне значимости 0,05. Построить линейное уравнение регрессии и объяснить его.

Решение.

Признак Х - выпуск продукции, тыс. шт (факторный признак).

Признак Y - себестоимость одного изделия, тыс. руб (результативный признак).

Предполагаем, что признаки имеют нормальный закон распределения. Определим форму связи. Построим точки с координатами (хi, yi) и по их расположению определим форму связи.

Итак, форма связи линейная. Проведем корреляционный анализ. Вычислим

выборочный линейный коэффициент корреляции:

Расчеты представим в таблице:

xi

yi

xi*yi

xi2

yi2

2

1,9

3,8

4

3,61

3

1,7

5,1

9

2,89

4

1,8

7,2

16

3,24

5

1,6

8

25

2,56

6

1,4

8,4

36

1,96

Сумма: 20

8,4

32,5

90

14,26


Таким образом, rв = = -0,904

Проверим значимость выборочного коэффициента корреляции. Для этого выдвигаем

гипотезы:

Н0: rген=0,

Н1: rген≠ 0.

Уровень значимости α = 0,05.

Для проверки нулевой гипотезы используем случайную величину, имеющую распределение Стьюдента с k = n-2 = 5-2 = 3.

Т = = = -4,234.

По таблице критических точек распределения Стьюдента определим tкрит. дв(0,05;3)=3,18. Сравниваем Тнабл и tкрит(0,05;3). Так как |Тнабл|>tкрит. дв(0,05;3), то есть Тнабл попало в критическую область, нулевая гипотеза отвергается, справедлива конкурирующая гипотеза: rген≠0.

Признаки Х и Y коррелированны, rв значим. Так как |rв| близок к единице, следовательно, выпуск продукции и себестоимость одного изделия находятся в тесной корреляционной зависимости.

Найдем коэффициент детерминации. D=⋅100%=81,8% , то есть вариация выпуска готовой продукции в среднем на 81,8 % объясняется себестоимостью одного изделия. Выразим эту связь аналитически в виде линейного уравнения регрессии:

Таким образом, y x -1,68≈-0,11 (x-4) или y x ≈-0,11x+2,12.

Из уравнения следует, что с увеличением себестоимости на 1 рубль, выпуск продукции уменьшится в среднем на 0,11 тыс. шт.