Таблица 2.7. Данные для расчета коэффициента корреляции и параметров уравнения прямой

п/п

x

y

x2

xy

y2

1

2

12

-10

-6

100

36

- 1,395

- 1,261

1,759

4

24

144

2

4

11

-8

-7

64

49

-1,116

- 1,470

1,641

16

44

121

3

6

14

-6

-2

36

16

- 0,837

- 0,840

0,703

36

84

196

4

8

16

-4

-2

16

4

- 0,558

- 0,420

0,234

64

128

256

5

10

17

-2

-1

4

1

- 0,279

-0,210

0,059

100

170

289

6

12

19

0

1

0

1

0

+0,210

0

144

228

361

7

15

20

3

2

9

4

0,418

+0,420

0,176

225

300

400

8

17

21

5

3

25

9

0,697

+0,704

0,491

289

357

441

9

20

23

8

5

64

25

1,116

+1,050

1,308

400

460

529

10

26

27

14

9

196

81

1,953

+1,891

3,693

676

702

729

120

180

514

226

0

0

9,836

1954

2497

3466

Расчет коэффициентов корреляции проводится по формуле (2.3):

Зависимость между показателями весьма высокая.

Коэффициент корреляции рассчитываем по формуле (2.4):

Рассчитанный коэффициент корреляции показывает, что качество товара - основной ценообразующий фактор.

Коэффициент детерминации d = r2, d = 0,982 = 0,96 означает, что цена товара на 96,0% зависит от качества, влияние прочих факторов составляет 4,0%.

Положительное значение коэффициента корреляции свидетельствует о наличии прямой связи между показа­телями.

НЕ нашли? Не то? Что вы ищете?

Определим зависимость между ценой и качеством то­вара на основе уравнение прямой:

y = а + bx.

Составим систему нормальных уравнений по данным табл. 2.7:

Умножив все члены первого уравнения на 12 и вычтя из второго уравнения первое, получим: 514b = 337; b = . Подставив полученное значение в первое или второе уравнение, получим а = 10,13.

Уравнение прямой примет вид: у = 10,13 + 0,66х.

Коэффициент регрессии b = 0,66 означает, что при изме­нении качества на 1 балл цена товара возрастает на 0,66 руб.

Этот условный пример показывает возможности метода в изучении зависимости между стохастическими показателями.

Математический аппарат регрессионного и корреляционного анализа оказался очень удобным для определения взаимозави­симостей между различными величинами. Но наряду с просто­той у этих видов анализа имеется существенный недостаток - исследуется только линейная зависимость между результирую­щим параметром и независимым фактором.

На практике значительно чаще встречаются многомерные за­висимости, т. е. такие, в которых результирующий параметр за­висит от многих факторов, и зависимости нелинейные.

Определение нелинейной корреляционной зависимости. Одним из способов нахождения зависимости является метод замены переменной. Этот метод довольно часто используется при реше­нии различных математических задач. Он заключается в том, что независимый фактор заменяется некоторой функцией этого фактора, которая переводит нелинейную зависимость в разряд линейных.

Например, рассмотрим нелинейную зависимость вида у = х2. Это не что иное, как парабола с вершиной в начале коорди­нат. Зависимость явно нелинейная. Чтобы убедиться в этом, достаточно посмотреть на график этой зависимости (рис.2.3).

Рис. 2.3. График зависимости у = х2

Сделаем замену переменной z = х2. После подстановки в исходное уравнение получим зависимость вида у = z, которая уже является линейной. Для нее можно использовать весь ма­тематический аппарат регрессионного и корреляционного анализа, т. е. можно находить регрессионное уравнение, ко­эффициенты парной корреляции, ошибки и т. д.

Некоторые виды подстановок приведены в табл. 2.8.

Таблица 2.8. Различные виды подстановок, с помощью которых осуществляется переход от нелинейных зависимостей к линейным

Вид нелинейной зависимости

Подстановка

1

Y = 1/(a + b · X)

Y = 1 / Y

2

Y = a + b / X

X = 1 / X

3

Y = X / (a + b · X)

Y = X / Y

4

Y = 1 / (a + b · exp(-X))

X = exp(-X) Y = 1 / Y

5

Y = a · exp(b · X)

Y = log(Y)

6

Y =

Y = Y 2

7

Y = exp[a + b · exp(X)]

X = exp(X) Y = log(Y)

8

Y = a + b · · log(X)

X = log(X)

9

Y = a · X / (b + X)

X = 1 / X Y = 1 /Y

Для нахождения лучшей подстановки можно использовать визуальный метод, когда «на глаз» определяется вид нелинейной зависимости, связывающей результирующий параметр и незави­симый фактор, а можно выбор наилучшей замены осуществлять, используя коэффициент корреляции. Та подстановка, у которой коэффициент корреляции является максимальным, и является наилучшей.

Метод множественной корреляции. Этот метод применяется в случаях когда результирующий показатель зависит от несколь­ких взаимно независимых факторов. При этом применяется уравнение множественной регрессии:

(2.5)

При n = 2 уравнение (2.5) превращается в обычное уравнение парной регрессии, при n = 3 это уравнение описывает плоскость, а при больших размерностях - гиперплоскость. Иногда эту ги­перплоскость называют поверхностью отклика. Для определения коэффициентов регрессионного уравнения используется исход­ный статистический материал (табл.2.9).

Таблица 2.9. Исходный статистический материал

Номер наблюдения

Фактор

Результирующий показатель

x1

x2

xn

y

1

x11

x12

x1n

y1

2

x21

x22

x2n

y2

m

xm1

xm2

xmn

yn

Необходимым условием для поиска коэффициентов является требование того, чтобы количество наблюдений было больше числа независимых факторов +1. Для определения коэффициен­тов регрессионного уравнения (2.5) удобнее всего использовать методы матричного исчисления. Для этого сделаем одно допу­щение, которое не меняет условия задачи. Будем считать, что в уравнении (2.5) свободный член a0 всегда умножается на неко­торый фиктивный фактор, имеющий постоянное значение, рав­ное единице, т. е. имеем:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86