или

,

где r - коэффициент корреляции;

x, y - значения изучаемых признаков;

- средние величины по каждому признаку;

- средняя величина произведения признаков x и y;

n - численность совокупности.

Наиболее удобной формулой для расчета коэффициента корреляции является следующая:

Коэффициент корреляции изменяется от -1 до +1. Чем ближе коэффициент корреляции к единице, тем связь между признаками теснее. Если коэффициент корреляции меньше нуля, то вязь признается обратной, больше нуля – прямой.

Существенность связи можно оценить укрупненно по таблицам Чэддока, но часто возникает необходимость дать более точную оценку существенности либо на основе t - критерия (при малых выборках), либо F критерия Фишера. Вероятностная оценка существенности коэффициента корреляции при малой выборке предпочтительно осуществляется на основе расчета значения t - критерия Стьюдента

,

где r - коэффициент корреляции;

n - число сопоставляемых пар наблюдений.

Полученное расчетное значение t - критерия Стьюдента сравнивают с его теоретической величиной в зависимости от 5% и 1% уровень значимости и n-1 числа степеней свободы (приложение В).

Если tрасч. > tтабл., то связь между фактором и результатом существенная и наоборот, если tрасч.< tтабл., то связь несущественная и данный фактор исключается из дальнейшего исследования.

Если численность выборки более 30, то вначале определяется случайная ошибка выборочного коэффициента корреляции по формуле:

,

где 2 - общая дисперсия;

S2 - дисперсия разностей между эмпирическими данными и линией регрессии (остаточная дисперсия).

НЕ нашли? Не то? Что вы ищете?

,

где y - эмпирические значения результативного признака;

- расчетные значения результативного признака.

Расчетные значения t - критерия Стьюдента определится:

tрасч.=

Далее сравнение расчетной величины с табличным значением t - критерия осуществляется аналогично вышеописанному.

В процессе изучения явления важно установить не только тесноту связи, но и рассчитать показатели, характеризующие взаимосвязь между признаками. Это осуществляется с помощью решения определенных регрессионных уравнений. Для аналитического выражения прямолинейной регрессии используют формулу прямой линии:

,

где - выровненное значение результативного признака;

a, b - параметры, представляющие средние значения постоянных показателей;

Параметры уравнения a и b определяют на основе метода наименьших квадратов, для чего решают систему нормальных уравнений.

.

Расчеты производятся в табличной форме, в которой подсчитываются значения å х,

å y, å x2 , å xy.

После нахождения параметров а и b записывается параметризованное уравнение прямой линии.

Параметры а и b должны быть оценены по статистическим критериям (t - критерий Стьюдента, F - критерий Фишера). Особое внимание должно быть уделено параметру b, называемому коэффициентом регрессии. Это связано с тем, что этот показатель, являясь мерой изменений зависимого признака, рассматриваемого как фактор, приобретает значения основания для операции экстраполирования.

Оценка существенности параметра b производиться на основе ошибки коэффициента регрессии:

,

где S2 - остаточная дисперсия;

x - варианты ряда (факторный признак);

- среднее значение ряда;

Расчетное значение t - критерия определяется:

.

Расчетное значение t - критерия сравнивается с его теоретическим значением по таблицам Стьюдента (приложение В) при n-2 степенях свободы при 5% и 1% уровне значимости. Если tрасч.>tтабл., то параметр b признается существенным.

Параметр а оценивается по формуле:

.

Расчетное значение t - критерия для параметра a определяется:

Аналогично с вышеописанным оно сравнивается с теоретическим значением и делается вывод о существенности параметра а.

УСЛОВИЯ ДЛЯ ЗАДАЧ 41-50

По приведенным ниже данным:

а) построить групповую таблицу, показывающую зависимость между двумя признаками;

б) дать графическое изображение зависимости;

в) рассчитать линейный коэффициент корреляции;

г) оценить существенность коэффициента корреляции;

д) построить линейное и одно из криволинейных уравнений зависимости между фактором и результатом, оценить параметры уравнений;

е) на основе ошибки аппроксимации выбрать лучшее уравнение;

ж) сделать выводы.

ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

Задача 41 - Имеются следующие данные о ширине ковшей пескомоек и их производительности:

Номер пескомойки

Ширина ковшей, мм

Средняя часовая производительность, м3

1

300

5,5

2

360

7,0

3

510

14,0

4

390

6,0

5

380

5,4

6

440

9,0

7

610

15,6

8

390

9,0

9

380

8,0

10

480

11,5

11

300

5,0

12

540

15,0

13

510

13,5

14

610

17,0

15

460

10,5

16

480

12,0

Задача 42 - Имеются данные по машиностроительному заводу о проценте бракованных поршневых колес и проценте влажности формовочной смеси (по данным эксперимента в литейном цехе), %:

Номер плавки

Влажность смеси

Брак

1

3,1

45,4

2

3

32,2

3

3,4

46,9

4

3,3

47,3

5

3,1

41,6

6

3,2

56,1

7

3,3

69,8

8

3,2

44,5

9

3,2

46,9

10

3,1

51,9

11

3,1

51,9

12

3

38,2

13

3,6

56,9

14

3,5

42,6

15

3,2

45

16

3,1

42,6

17

3,3

48,3

18

3

22,2

19

3,5

53,7

20

3,6

57

Задача 43 - Имеются следующие данные о численности рабочих и объеме основных фондов:

Номер завода

Средняя списочная численность рабочих, чел

Объем основных фондов на начало отчетного периода, млн. руб.

1

350

6

2

810

14

3

470

8

4

510

8

5

400

9

6

650

10

7

660

9

8

700

11

9

750

12

10

400

3

11

380

5

12

800

13

13

740

12

14

460

6

15

500

10

16

490

11

17

640

9

Задача 44 - Имеются следующие данные о качестве ковкого чугуна (относительное удлинение в процентах) и его химическом составе (содержание углерода в процентах), %:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13