Лабораторная работа 2

По территориям региона приводятся данные за 199Х г.

Номер региона

Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х

Среднедневная заработная плата,

руб., у

1

78+N

133+N

2

82-N

148+N

3

87+N

134-N

4

79-N

154-N

5

89+N

162+N

6

106-N

195+N

7

67+N

139-N

8

88-N

158-N

9

73+N

152+N

10

87-N

162+N

11

76+N

159-N

12

115-N

173-N

Требуется:

1. Построить линейное уравнение парной регрессии у от х.

2. Рассчитать линейный коэффициент парной корреляции, сред­нюю ошибку аппроксимации.

3. Оценить статистическую значимость уравнения в целом и параметров регрессии и корреляции.

4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.

5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Решение

1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу

х

y

ух

x2

y2

1

78

133

10374

6084

17689

149

-16

256

12,0

2

82

148

12136

6724

21904

152

-4

16

2,7

3

87

134

11658

7569

17956

157

-23

529

17,2

4

79

154

12166

6241

23716

150

4

16

2,6

5

89

162

14418

7921

26244

159

3

9

1,9

6

106

195

20670

11236

38025

174

21

441

10,8

7

67

139

9313

4489

19321

139

0

0

0,0

8

88

158

13904

7744

24964

158

0

0

0,0

9

73

152

11096

5329

23104

144

8

64

5,3

10

87

162

14094

7569

26244

157

5

25

3,1

11

76

159

12084

5776

25281

147

12

144

7,5

12

115

173

19895

13225

29929

183

-10

100

5,8

Итого

1027

1869

161808

89907

294377

1869

0

1600

68,9

Среднее значение

85,6

155,8

13484,0

7492,3

24531,4

5,7

12,84

16,05

164,94

257,76

НЕ нашли? Не то? Что вы ищете?

Получено уравнение регрессии: . С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.

2. Тесноту линейной связи оценит коэффициент корреляции:

Это означает, что 52% вариации заработной платы (у) объясняет­ся вариацией фактора х - среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:

Качество построенной модели оценивается как хорошее, так как А не превышает 8 - 10%.

3.Рассчитаем F - критерий.

, .

-гипотеза о статистической незначимости уравнения регрессии отклоняется.

Оценку статистической значимости параметров регрессии прове­дем с помощью t-статистики Стьюдента и путем расчета довери­тельного интервала каждого из показателей.

Выдвигаем гипотезу H0 о статистически незначимом отличии показателей от нуля:

tтабл для числа степеней свободы и составит 2,23.

Определим случайные ошибки :

.

Тогда

Фактические значения t-статистики превосходят табличные значе­ния:

поэтому гипотеза H0 отклоняется, т. е. a, b и не случайно отлича­ются от нуля, а статистически значимы.

Рассчитаем доверительный интервал для а и b. Для этого опре­делим предельную ошибку для каждого показателя:

Доверительные интервалы:

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью пара­метры а и b, находясь в указанных границах, не принимают нулевых значений, т. е. не являются статистически незначимыми и сущест­венно отличны от нуля.

4. Полученные оценки уравнения регрессии позволяют исполь­зовать его для прогноза. Если прогнозное значение прожиточного минимума составит: тыс. руб. тогда прогнозное значение среднедневной заработной платы составит:

тыс. руб.

5. Ошибка прогноза составит:

тыс. руб.

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

Доверительный интервал прогноза:

руб.;

руб.

2 способ.

При выполнении лабораторной работы можно использовать программу Excel (Сервис, Анализ данных, Регрессия).

В результате получим таблицу вида

Таблица 1

Регрессионная статистика

Множественный R

0,

R-квадрат

0,

Нормированный R-квадрат

0,

Стандартная ошибка

12,5495908

Наблюдения

12

Таблица 2

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

1705,327706

1705,327706

10,

0,

Остаток

10

1574,922294

157,4922294

Итого

11

3280,25

Таблица 3

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

76,9764852

24,

3,

0,

23,

130,9232056

Переменная X 1

0,

0,

3,

0,

0,

1,

ВЫВОД ОСТАТКА

 

Таблица 4

 

Наблюдение

Предсказанное Y

Остатки

 

1

148,7700683

-15,

 

2

152,4517905

-4,

 

3

157,0539433

-23,

 

4

149,6904989

4,

 

5

158,8948044

3,

 

6

174,5421238

20,

 

7

138,6453322

0,

 

8

157,9743738

0,

 

9

144,1679155

7,

 

10

157,0539433

4,

 

11

146,9292072

12,0707928

 

12

182,8259988

-9,

 

В использование таблицы Вам поможет цветовая схема

Пункт 1. Параметры линейного уравнения парной регрессии y от x расположены в таблице 3.

Пункт 2. Коэффициент корреляции находится в таблице 1. Для нахождения средней ошибки аппроксимации можно использовать столбец остатков из таблицы 4.

Пункт 3. Фактическое значение F-критерия находится в таблице 2, а t-статистика – в таблице 3.

Пункт 4. Прогнозное значение подсчитывается подстановкой интересуемого значения x в уравнение регрессии.

Пункт 5. Значение Sост, используемое в формуле для подсчета ошибки прогноза расположено в таблице 1.