или
,
где r - коэффициент корреляции;
x, y - значения изучаемых признаков;
- средние величины по каждому признаку;
- средняя величина произведения признаков x и y;
n - численность совокупности.
Наиболее удобной формулой для расчета коэффициента корреляции является следующая:

Коэффициент корреляции изменяется от -1 до +1. Чем ближе коэффициент корреляции к единице, тем связь между признаками теснее. Если коэффициент корреляции меньше нуля, то вязь признается обратной, больше нуля – прямой.
Существенность связи можно оценить укрупненно по таблицам Чэддока, но часто возникает необходимость дать более точную оценку существенности либо на основе t - критерия (при малых выборках), либо F критерия Фишера. Вероятностная оценка существенности коэффициента корреляции при малой выборке предпочтительно осуществляется на основе расчета значения t - критерия Стьюдента
,
где r - коэффициент корреляции;
n - число сопоставляемых пар наблюдений.
Полученное расчетное значение t - критерия Стьюдента сравнивают с его теоретической величиной в зависимости от 5% и 1% уровень значимости и n-1 числа степеней свободы (приложение В).
Если tрасч. > tтабл., то связь между фактором и результатом существенная и наоборот, если tрасч.< tтабл., то связь несущественная и данный фактор исключается из дальнейшего исследования.
Если численность выборки более 30, то вначале определяется случайная ошибка выборочного коэффициента корреляции по формуле:
,
где
2 - общая дисперсия;
S2 - дисперсия разностей между эмпирическими данными и линией регрессии (остаточная дисперсия).
,
где y - эмпирические значения результативного
признака;
- расчетные значения результативного признака.
Расчетные значения t - критерия Стьюдента определится:
tрасч.= ![]()
Далее сравнение расчетной величины с табличным значением t - критерия осуществляется аналогично вышеописанному.
В процессе изучения явления важно установить не только тесноту связи, но и рассчитать показатели, характеризующие взаимосвязь между признаками. Это осуществляется с помощью решения определенных регрессионных уравнений. Для аналитического выражения прямолинейной регрессии используют формулу прямой линии:
,
где
- выровненное значение результативного признака;
a, b - параметры, представляющие средние значения постоянных показателей;
Параметры уравнения a и b определяют на основе метода наименьших квадратов, для чего решают систему нормальных уравнений.
.
Расчеты производятся в табличной форме, в которой подсчитываются значения å х,
å y, å x2 , å xy.
После нахождения параметров а и b записывается параметризованное уравнение прямой линии.
Параметры а и b должны быть оценены по статистическим критериям (t - критерий Стьюдента, F - критерий Фишера). Особое внимание должно быть уделено параметру b, называемому коэффициентом регрессии. Это связано с тем, что этот показатель, являясь мерой изменений зависимого признака, рассматриваемого как фактор, приобретает значения основания для операции экстраполирования.
Оценка существенности параметра b производиться на основе ошибки коэффициента регрессии:
,
где S2 - остаточная дисперсия;
x - варианты ряда (факторный признак);
- среднее значение ряда;
Расчетное значение t - критерия определяется:
.
Расчетное значение t - критерия сравнивается с его теоретическим значением по таблицам Стьюдента (приложение В) при n-2 степенях свободы при 5% и 1% уровне значимости. Если tрасч.>tтабл., то параметр b признается существенным.
Параметр а оценивается по формуле:
.
Расчетное значение t - критерия для параметра a определяется:

Аналогично с вышеописанным оно сравнивается с теоретическим значением и делается вывод о существенности параметра а.
УСЛОВИЯ ДЛЯ ЗАДАЧ 41-50
По приведенным ниже данным:
а) построить групповую таблицу, показывающую зависимость между двумя признаками;
б) дать графическое изображение зависимости;
в) рассчитать линейный коэффициент корреляции;
г) оценить существенность коэффициента корреляции;
д) построить линейное и одно из криволинейных уравнений зависимости между фактором и результатом, оценить параметры уравнений;
е) на основе ошибки аппроксимации выбрать лучшее уравнение;
ж) сделать выводы.
ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ
Задача 41 - Имеются следующие данные о ширине ковшей пескомоек и их производительности:
Номер пескомойки | Ширина ковшей, мм | Средняя часовая производительность, м3 |
1 | 300 | 5,5 |
2 | 360 | 7,0 |
3 | 510 | 14,0 |
4 | 390 | 6,0 |
5 | 380 | 5,4 |
6 | 440 | 9,0 |
7 | 610 | 15,6 |
8 | 390 | 9,0 |
9 | 380 | 8,0 |
10 | 480 | 11,5 |
11 | 300 | 5,0 |
12 | 540 | 15,0 |
13 | 510 | 13,5 |
14 | 610 | 17,0 |
15 | 460 | 10,5 |
16 | 480 | 12,0 |
Задача 42 - Имеются данные по машиностроительному заводу о проценте бракованных поршневых колес и проценте влажности формовочной смеси (по данным эксперимента в литейном цехе), %:
Номер плавки | Влажность смеси | Брак |
1 | 3,1 | 45,4 |
2 | 3 | 32,2 |
3 | 3,4 | 46,9 |
4 | 3,3 | 47,3 |
5 | 3,1 | 41,6 |
6 | 3,2 | 56,1 |
7 | 3,3 | 69,8 |
8 | 3,2 | 44,5 |
9 | 3,2 | 46,9 |
10 | 3,1 | 51,9 |
11 | 3,1 | 51,9 |
12 | 3 | 38,2 |
13 | 3,6 | 56,9 |
14 | 3,5 | 42,6 |
15 | 3,2 | 45 |
16 | 3,1 | 42,6 |
17 | 3,3 | 48,3 |
18 | 3 | 22,2 |
19 | 3,5 | 53,7 |
20 | 3,6 | 57 |
Задача 43 - Имеются следующие данные о численности рабочих и объеме основных фондов:
Номер завода | Средняя списочная численность рабочих, чел | Объем основных фондов на начало отчетного периода, млн. руб. |
1 | 350 | 6 |
2 | 810 | 14 |
3 | 470 | 8 |
4 | 510 | 8 |
5 | 400 | 9 |
6 | 650 | 10 |
7 | 660 | 9 |
8 | 700 | 11 |
9 | 750 | 12 |
10 | 400 | 3 |
11 | 380 | 5 |
12 | 800 | 13 |
13 | 740 | 12 |
14 | 460 | 6 |
15 | 500 | 10 |
16 | 490 | 11 |
17 | 640 | 9 |
Задача 44 - Имеются следующие данные о качестве ковкого чугуна (относительное удлинение в процентах) и его химическом составе (содержание углерода в процентах), %:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 |


