По данным, представленным в табл. 2.6 (n=25), изучается зависимость объема выпуска продукции Y (млн. руб) от следующих факторов (переменных):

Х1-численность промышленно-производственного персонала, чел.;

Х2-среднегодовая стоимость основных фондов, млн. руб.;

Х3-износ основных фондов,%

Х4-электровооруженность, кВт*ч;

Х5-техническая вооруженность одного рабочего, млн. руб.;

Х6-выработка товарной продукции на одного работающего, руб; 


Y

X1

X2

X3

X4

X5

X6

32900

864

16144

39,5

4,9

3,2

36354

203456

8212

336472

46,4

60,5

20,4

23486

41138

1866

39208

43,7

24,9

9,5

20866

56320

1500

64235

32,3

49,6

34

52123

26900

1600

32563

66,2

6,9

18

18563

93540

4752

90236

52,3

36,2

12,6

21523

27532

1752

46258

40,2

42,3

20,1

19523

98256

4100

125326

46,6

70,3

13,6

24587

100850

7001

122563

48,8

32,6

9

16524

173256

5021

205147

56,3

140,2

31,2

33254

2600

620

7230

69,9

17,2

6

6896

17000

952

8320

38,3

17,6

7

23561

19000

1002

17526

61,8

26,3

13

21523

22000

4002

25456

34,1

14,2

4,1

5698

124052

53002

185321

36,1

39,1

18,3

21563

86123

5263

159632

42,1

55,3

20,6

19632

160256

7521

140200

46,9

36,1

13,6

25486

9562

930

5969

45,1

15,3

4,1

12563

5236

523

585

41,3

0,6

0,9

8546

57201

2369

59632

56,3

38,6

12,9

18999

301256

11236

480258

50,9

75,8

22,1

29658

96253

5632

99521

52,9

31,6

13,6

18524

98010

3801

160214

60,4

75,9

27,2

26756

1087322

46142

972349

50

27,5

10,8

23176

55004

2535

163695

25,5

65,5

19,9

21698


Задание: 

НЕ нашли? Не то? Что вы ищете?
Построить матрицу парных коэффициентов корреляции. Установить, какие факторы мультиколлинеарны. Построить уравнение множественной регрессии в линейной форме с полным набором факторов. Оценить статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель регрессии за счет значимых факторов. Оценить качество уравнения регрессии с помощью коэффициента детерминации. Рассчитать прогнозные значения результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Решение:

Построим матрицу парных коэффициентов корреляции, выполнив следующие действия:  EXCEL => Данные => Анализ данных => Корреляция

Y

X1

X2

X3

X4

X5

X6

Y

1

X1

0,678707

1

X2

0,963603

0,681374

1

X3

0,071156

-0,12153

0,03684

1

X4

0,134687

0,040176

0,282595

0,048248

1

X5

0,080794

0,076276

0,214058

0,016159

0,775846

1

X6

0,143556

0,036297

0,18261

-0,20183

0,447933

0,659773

1

Анализ матрицы коэффициентов парной корреляции показывает, что  зависимая переменная, т. е. объем выпуска продукции Y (млн. руб), имеет тесную связь с  численностью промышленно-производственного персонала (rYX1 = 0,678) и со среднегодовой стоимостью основных фондов, (rYX2 = 0,682). Однако факторы Х1 и Х2 тесно связаны между собой (rХ1X2 = 0,53), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х2 – среднегодовая стоимость основных фондов, переменная Х1 выбывает. Факторы Х4 и Х6 тоже связаны с зависимой переменной.  Факторы Х3 и Х5 – выбывают, т. к. влияние на зависимую переменную у незначительна. 

2) Построим уравнение множественной регрессии в линейной форме с полным набором факторов.

Выполняем следующие действия:  Данные => Анализ данных => Регрессия.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0.978530883

R-квадрат

0.957522689

Нормированный R-квадрат

0.943363585

Стандартная ошибка

50869.34764

Наблюдения

25

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

6

1049970015873.180

174995002645.530

67.626

0.000

Остаток

18

46578429536.658

2587690529.814

Итого

24

1096548445409.840

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Y-пересечение

-72974.74226

61089.35074

-1.195

0.248

-201318.705

55369.221

-201318.705

X1

0.759663199

1.155046423

0.658

0.519

-1.667

3.186

-1.667

X2

0.9998182

0.075753984

13.198

0.000

0.841

1.159

0.841

X3

1377.503354

1039.67118

1.325

0.202

-806.765

3561.771

-806.765

X4

-623.3334398

578.7545344

-1.077

0.296

-1839.252

592.585

-1839.252

X5

-3282.718245

2363.884362

-1.389

0.182

-8249.055

1683.619

-8249.055

X6

2.383827335

1.553048176

1.535

0.142

-0.879

5.647

-0.879

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

1

71336.68096

-38436.68096

2

284898.0404

-81442.0404

3

30874.67303

10263.32697

4

18603.90621

37716.09379

5

32849.57865

-5949.578645

6

80278.39311

13261.60689

7

-15828.76736

43360.76736

8

89780.60262

8475.397376

9

111631.7701

-10781.77006

10

102962.3065

70293.69354

11

17033.64765

-14433.64765

12

11040.98259

5959.017409

13

22677.07042

-3677.070424

14

-6237.765152

28237.76515

15

169260.4938

-45208.49377

16

93324.19843

-7201.198433

17

131125.0218

29130.97824

18

2776.937011

6785.062989

19

1942.085697

3293.914303

20

44882.09701

12318.90299

21

436749.2464

-135493.2464

22

83492.22812

12760.77188

23

100479.5531

-2469.553075

24

1005777.587

81544.41274

25

73312.43185

-18308.43185



Коэффициенты уравнения регрессии а0,  а1, а2, а3, а4, а5, а6 берем из регрессионного анализа.

Уравнение регрессии зависимости у от х записываем в следующем виде:

y=-72974,74+0,759X1+0,99X2+1377,5X3-623,33X4-3282,71X5+2,38X6

3) Оценим статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента:

       Для расчета параметров и оценки качества модели был проведен регрессионный анализ.

Проверку значимости уравнения регрессии произведем на основе F-критерия Фишера. Из регрессионного анализа видно,  что он  равен Fрасч = 67,62.

Табличное значение F-критерия при доверительной вероятности б = 0,05 при

k1 = k = 6 

k2 = n – k – 1 = 25 – 6 – 1 = 18

составляет Fтабл = 2,66

Так как  Fрасч = 67,62 > Fтабл = 2,66 следует признать уравнение регрессии  статистически значимым.

Для проверки статистической значимости коэффициентов уравнения множественной регрессии проводим сравнение фактических значений t-статистики с табличными значениями t-критерия Стьюдента.

tтабл для числа степеней свободы 18 (n - k - 1 = 25 - 6 - 1 = 18) и б = 0,05 составит 2,1009.

Сравнивая значения t-статистики и tтабл,

t-статистика

-1,194557503

0,657690621

13,19822598

1,324941368

-1,077025583

-1,388696629

1,53493457

приходим к выводу, что так как

|tX1| = 0,65< 2,1009 = tтабл коэффициент регрессии Х1 является статистически незначимым, ненадежным;

|tX2| = 13,19> 2,1009 = tтабл коэффициент регрессии Х2 является статистически значимым, надежным;;

|tX3| = 1,32< 2,1009 = tтабл коэффициент регрессии Х3 является статистически незначимым, ненадежным;

|tX4| =-1,07 < 2,1009 = tтабл коэффициент регрессии Х4 является статистически незначимым, ненадежным;

|tX5| = -1,38 < 2,1009 = tтабл коэффициент регрессии Х5 является статистически незначимым, ненадежным;

|tX6| = 1,53 < 2,1009 = tтабл коэффициент регрессии Х6 является статистически незначимым, ненадежным

4) Используя пошаговую множественную регрессию (метод исключения), строим модель регрессии за счет значимых факторов.

Из модели исключаем фактор Х1 по свойству мультиколлинеарности, а так же факторы Х3, , Х5, как  слабо связанные с у.

Следовательно, после исключения незначимых факторов n = 25, k = 3.

Для расчета параметров и оценки качества модели после исключения незначимых переменных проведем регрессионный анализ:


№ наблюдения

Y

X2

X4

X6

1.00

32900.00

16144.00

4.90

36354.00

2.00

203456.00

336472.00

60.50

23486.00

3.00

41138.00

39208.00

24.90

20866.00

4.00

56320.00

64235.00

49.60

52123.00

5.00

26900.00

32563.00

6.90

18563.00

6.00

93540.00

90236.00

36.20

21523.00

7.00

27532.00

46258.00

42.30

19523.00

8.00

98256.00

125326.00

70.30

24587.00

9.00

100850.00

122563.00

32.60

16524.00

10.00

173256.00

205147.00

140.20

33254.00

11.00

2600.00

7230.00

17.20

6896.00

12.00

17000.00

8320.00

17.60

23561.00

13.00

19000.00

17526.00

26.30

21523.00

14.00

22000.00

25456.00

14.20

5698.00

15.00

124052.00

185321.00

39.10

21563.00

16.00

86123.00

159632.00

55.30

19632.00

17.00

160256.00

140200.00

36.10

25486.00

18.00

9562.00

5969.00

15.30

12563.00

19.00

5236.00

585.00

0.60

8546.00

20.00

57201.00

59632.00

38.60

18999.00

21.00

301256.00

480258.00

75.80

29658.00

22.00

96253.00

99521.00

31.60

18524.00

23.00

98010.00

160214.00

75.90

26756.00

24.00

1087322.00

972349.00

27.50

23176.00

25.00

55004.00

163695.00

65.50

21698.00


ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0.974690945

R-квадрат

0.950022438

Нормированный R-квадрат

0.942882786

Стандартная ошибка

51084.812

Наблюдения

25

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

3

1041745627060.89

347248542353.63

133.06

0.00

Остаток

21

54802818348.95

2609658016.62

Итого

24

1096548445409.84

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95.0%

Верхние 95.0%

Y-пересечение

1349.0261

26474.58

0.05

0.96

-53707.88

56405.93

-53707.88

56405.93

Переменная X 1

1.041912761

0.05

19.70

0.00

0.93

1.15

0.93

1.15

Переменная X 2

-1162.916951

397.16

-2.93

0.01

-1988.86

-336.98

-1988.86

-336.98

Переменная X 3

0.755947915

1.22

0.62

0.54

-1.79

3.30

-1.79

3.30

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

1

39953.10314

-7053.103143

2

299321.2138

-95865.21378

3

29017.31873

12120.68127

4

49997.88467

6322.115327

5

41285.36551

-14385.36551

6

69539.73933

24000.26067

7

15112.81069

12419.18931

8

68761.21448

29494.78552

9

103629.1706

-2779.170552

10

77191.63865

96064.36135

11

-5907.099381

8507.099381

12

7361.290746

9638.709254

13

5295.140297

13704.8597

14

15665.92785

6334.072148

15

165267.793

-41215.79296

16

118203.106

-32080.10601

17

124709.9818

35546.0182

18

-727.4523326

10289.45233

19

7721.125773

-2485.125773

20

32954.02797

24246.97203

21

436006.7632

-134750.7632

22

82296.22949

13956.77051

23

100238.783

-2228.782986

24

999991.49

87330.50998

25

112136.433

-57132.43305



Полученное  уравнение регрессии зависимости объема выпуска продукции Y (млн. руб) от среднегодовая стоимость основных фондов имеет следующий вид: 

  y=1349.0261+1.0419X2-1162.9 Х4+0.75Х6

Коэффициент детерминации равен R2 = 0,95, следовательно, уравнение регрессии можно считать статистически значимым, т. е. 95% вариаций зависимой переменной Y учтено в модели и обусловлено влиянием факторов Х2, Х4, Х6.

5) Рассчитаем прогнозные значения результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Хпр 2 = Хmax 2 * 0,8 = 972349*0,8=777879,2

Хпр 4 = Хmax 4 * 0,8 = 140.20*0,8= 112.16

Хпр 6 = Хmax 6 * 0,8 = 52123.00*0,8= 41698.4

Yпр = 1349.0261+1.0419*777879,2-1162.9 *112,16+0.75*41698,4=712664.3

Объем выпуска продукции составит 712664.3 млн. руб.

Список используемой литературы.

«Эконометрика» – учебник. , . М.: Издательство «Финансы и статистика» -2001 г. «Практикум по эконометрике». , . М.: Издательство «Финансы и статистика» -2001 г. «Эконометрика» - задания для выполнения контрольной и лабораторной работы М.: вузовский учебник, 2007г.

Подпись: