2.  Математическое ожидание возмущения равна нулю:

(iii)

(или математическое ожидание зависимой переменной равно линейной функции регрессии:

3.  Дисперсия возмущения (или зависимой переменной постоянна для любого

(iiii)

(или условие равноизменчивости возмущения (зависимой переменной)).

4.  Возмущения и (или переменные и ) не коррелированы:

(iiiii)

5.  Возмущение (или зависимая переменная ) есть нормально распределенная случайная величина.

Для получения уравнения регрессии достаточно первых четырех предпосылок.

Требование выполнения пятой предпосылки необходимо для оценки точности уравнения регрессии и его параметров.

Оценкой модели (ii) по выборке является уравнение регрессии Параметры этого уравнения и определяются на основе метода наименьших квадратов, который будет изложен ниже.

Воздействие нучтенных случайных факторов и ошибок наблюдений в модели (ii)

определяется с помощью дисперсии возмущений (ошибок) или остаточной дисперсии Несмещенной оценкой этой дисперсии является выборочная остаточная дисперсия

(*)

где групповая средняя, найденная по уравнению регрессии; выборочная оценка возмущений или остаток регрессии.

В знаменателе выражения (*) стоит число степеней свободы а не так как две степени свободы теряются при определении двух параметров прямой и

Данные о статистической зависимости признаков и удобно задавать в виде корреляционной таблицы.

Рассмотрим в качестве примера зависимость между суточной выработкой продукции (т) и величиной основных производственных фондов (ОПФ)(млн. руб.) для совокупности 50 однотипных предприятий (табл. 19).

НЕ нашли? Не то? Что вы ищете?

Таблица 19

Величина ОПФ

(млн. руб)

Середины интервалов \

Суточная выработка продукции, т (Y)

Всего

Групповая

средняя, т

7-11

11-15

15-19

19-23

23-27

9

13

17

21

25

20-25

25-30

30-35

35-40

40-45

22,5

27,5

32,5

37,5

42,5

2

3

-

-

-

1

6

3

1

-

-

4

11

2

-

-

-

7

6

1

-

-

-

2

1

3

13

21

11

2

10,3

13,3

17,8

20,3

23,0

Всего

5

11

17

14

3

50

-

Групповая средняя млн. руб

25,5

29,3

31,9

35,4

39,2

-

-

(В таблице и - середины соответствующих интервалов, и - соответственно их частоты).

На рис. 17 и 18 представлены эмпирические линии регрессии (групповых средних) в системах координат Y по Х и Х по У соответстенно.

Рис.17

Рис. 18

В таблице групповые средние по и вычислены соответственно по формулам:

(5) и , (6) где частоты пар и число интервалов по переменной число интервалов по переменной

По виду ломаных можно предположить наличие линейной корреляционной зависимости по и по между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки (*)

Поэтому уравнение регрессии (3) будем искать в виде:

(7)

Методом наименьших квадратов (МНК) найдем формулы расчета неизвестных параметров и уравнения линейной регрессии (7).

Согласно МНК неизвестные параметры и выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних , вычисленных по формуле (6), от значений найденных по уравнению регрессии (6), была минимальной:

. (8)

На основании необходимого условия экстремума функции двух переменных приравниваем к нулю ее частные производные, т. е.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28