
Таблица 2.7. Данные для расчета коэффициента корреляции и параметров уравнения прямой
№ п/п | x | y |
|
|
|
|
|
|
| x2 | xy | y2 |
1 | 2 | 12 | -10 | -6 | 100 | 36 | - 1,395 | - 1,261 | 1,759 | 4 | 24 | 144 |
2 | 4 | 11 | -8 | -7 | 64 | 49 | -1,116 | - 1,470 | 1,641 | 16 | 44 | 121 |
3 | 6 | 14 | -6 | -2 | 36 | 16 | - 0,837 | - 0,840 | 0,703 | 36 | 84 | 196 |
4 | 8 | 16 | -4 | -2 | 16 | 4 | - 0,558 | - 0,420 | 0,234 | 64 | 128 | 256 |
5 | 10 | 17 | -2 | -1 | 4 | 1 | - 0,279 | -0,210 | 0,059 | 100 | 170 | 289 |
6 | 12 | 19 | 0 | 1 | 0 | 1 | 0 | +0,210 | 0 | 144 | 228 | 361 |
7 | 15 | 20 | 3 | 2 | 9 | 4 | 0,418 | +0,420 | 0,176 | 225 | 300 | 400 |
8 | 17 | 21 | 5 | 3 | 25 | 9 | 0,697 | +0,704 | 0,491 | 289 | 357 | 441 |
9 | 20 | 23 | 8 | 5 | 64 | 25 | 1,116 | +1,050 | 1,308 | 400 | 460 | 529 |
10 | 26 | 27 | 14 | 9 | 196 | 81 | 1,953 | +1,891 | 3,693 | 676 | 702 | 729 |
| 120 | 180 | 514 | 226 | 0 | 0 | 9,836 | 1954 | 2497 | 3466 |
Расчет коэффициентов корреляции проводится по формуле (2.3):
![]()
Зависимость между показателями весьма высокая.
Коэффициент корреляции рассчитываем по формуле (2.4):

Рассчитанный коэффициент корреляции показывает, что качество товара - основной ценообразующий фактор.
Коэффициент детерминации d = r2, d = 0,982 = 0,96 означает, что цена товара на 96,0% зависит от качества, влияние прочих факторов составляет 4,0%.
Положительное значение коэффициента корреляции свидетельствует о наличии прямой связи между показателями.
Определим зависимость между ценой и качеством товара на основе уравнение прямой:
y = а + bx.
Составим систему нормальных уравнений по данным табл. 2.7:

Умножив все члены первого уравнения на 12 и вычтя из второго уравнения первое, получим: 514b = 337; b =
. Подставив полученное значение в первое или второе уравнение, получим а = 10,13.
Уравнение прямой примет вид: у = 10,13 + 0,66х.
Коэффициент регрессии b = 0,66 означает, что при изменении качества на 1 балл цена товара возрастает на 0,66 руб.
Этот условный пример показывает возможности метода в изучении зависимости между стохастическими показателями.
Математический аппарат регрессионного и корреляционного анализа оказался очень удобным для определения взаимозависимостей между различными величинами. Но наряду с простотой у этих видов анализа имеется существенный недостаток - исследуется только линейная зависимость между результирующим параметром и независимым фактором.
На практике значительно чаще встречаются многомерные зависимости, т. е. такие, в которых результирующий параметр зависит от многих факторов, и зависимости нелинейные.
Определение нелинейной корреляционной зависимости. Одним из способов нахождения зависимости является метод замены переменной. Этот метод довольно часто используется при решении различных математических задач. Он заключается в том, что независимый фактор заменяется некоторой функцией этого фактора, которая переводит нелинейную зависимость в разряд линейных.
Например, рассмотрим нелинейную зависимость вида у = х2. Это не что иное, как парабола с вершиной в начале координат. Зависимость явно нелинейная. Чтобы убедиться в этом, достаточно посмотреть на график этой зависимости (рис.2.3).

Рис. 2.3. График зависимости у = х2
Сделаем замену переменной z = х2. После подстановки в исходное уравнение получим зависимость вида у = z, которая уже является линейной. Для нее можно использовать весь математический аппарат регрессионного и корреляционного анализа, т. е. можно находить регрессионное уравнение, коэффициенты парной корреляции, ошибки и т. д.
Некоторые виды подстановок приведены в табл. 2.8.
Таблица 2.8. Различные виды подстановок, с помощью которых осуществляется переход от нелинейных зависимостей к линейным
№ | Вид нелинейной зависимости | Подстановка |
1 | Y = 1/(a + b · X) | Y = 1 / Y |
2 | Y = a + b / X | X = 1 / X |
3 | Y = X / (a + b · X) | Y = X / Y |
4 | Y = 1 / (a + b · exp(-X)) | X = exp(-X) Y = 1 / Y |
5 | Y = a · exp(b · X) | Y = log(Y) |
6 | Y = | Y = Y 2 |
7 | Y = exp[a + b · exp(X)] | X = exp(X) Y = log(Y) |
8 | Y = a + b · · log(X) | X = log(X) |
9 | Y = a · X / (b + X) | X = 1 / X Y = 1 /Y |
Для нахождения лучшей подстановки можно использовать визуальный метод, когда «на глаз» определяется вид нелинейной зависимости, связывающей результирующий параметр и независимый фактор, а можно выбор наилучшей замены осуществлять, используя коэффициент корреляции. Та подстановка, у которой коэффициент корреляции является максимальным, и является наилучшей.
Метод множественной корреляции. Этот метод применяется в случаях когда результирующий показатель зависит от нескольких взаимно независимых факторов. При этом применяется уравнение множественной регрессии:
(2.5)
При n = 2 уравнение (2.5) превращается в обычное уравнение парной регрессии, при n = 3 это уравнение описывает плоскость, а при больших размерностях - гиперплоскость. Иногда эту гиперплоскость называют поверхностью отклика. Для определения коэффициентов регрессионного уравнения используется исходный статистический материал (табл.2.9).
Таблица 2.9. Исходный статистический материал
Номер наблюдения | Фактор | Результирующий показатель | |||
x1 | x2 | … | xn | y | |
1 | x11 | x12 | … | x1n | y1 |
2 | x21 | x22 | … | x2n | y2 |
… | … | … | … | … | … |
m | xm1 | xm2 | … | xmn | yn |
Необходимым условием для поиска коэффициентов является требование того, чтобы количество наблюдений было больше числа независимых факторов +1. Для определения коэффициентов регрессионного уравнения (2.5) удобнее всего использовать методы матричного исчисления. Для этого сделаем одно допущение, которое не меняет условия задачи. Будем считать, что в уравнении (2.5) свободный член a0 всегда умножается на некоторый фиктивный фактор, имеющий постоянное значение, равное единице, т. е. имеем:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 |


