5) Оценив вышеприведенные модели, делаем вывод, что следует всё-таки оставить модель линейной, то есть не логарифмировать. Получаем следующую регрессионную модель:

Таблица 2.9.

Выбранная регрессионная модель

Dependent Variable: YNEW

Method: Least Squares

Date: 05/18/13 Time: 18:08

Sample (adjusted): 2 71

Included observations: 68 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.

YESNO

45.50812

21.36355

2.130176

0.0373

TEATR

-0.879038

2.541623

-0.345857

0.7307

Q

0.006010

0.004721

1.273087

0.2079

NUMBER

-0.374582

0.324859

-1.153059

0.2535

MEROPR

0.003705

0.006039

0.613499

0.5419

INCOME

0.009923

0.002439

4.068057

0.0001

HOTEL

-0.130246

0.308468

-0.422233

0.6744

C

-67.12345

33.15462

-2.024558

0.0474

R-squared

0.260317

Mean dependent var

47.45588

Adjusted R-squared

0.174021

S. D. dependent var

93.75701

S. E. of regression

85.20953

Akaike info criterion

11.83823

Sum squared resid

435639.9

Schwarz criterion

12.09935

Log likelihood

-394.5000

Hannan-Quinn criter.

11.94170

F-statistic

3.016554

Durbin-Watson stat

2.538939

Prob(F-statistic)

0.008777

6) Затем, для улучшения модели, избавляемся от лишних переменных. Для этого проделываем соответствующий тест на Redundant Variables.

Таблица 2.10.

Тест на лишние переменные

Redundant Variables: HOTEL MEROPR Q TEATR

F-statistic

0.678514

 Prob. F(4,60)

0.6095

Log likelihood ratio

3.008389

 Prob. Chi-Square(4)

0.5564

Test Equation:

Dependent Variable: YNEW

Method: Least Squares

Date: 05/19/13 Time: 16:46

Sample: 2 71

Included observations: 68

Variable

Coefficient

Std. Error

t-Statistic

Prob.

YESNO

46.02572

20.98141

2.193643

0.0319

INCOME

0.008326

0.002167

3.841418

0.0003

NUMBER

-0.344483

0.108612

-3.171693

0.0023

C

-38.87420

26.16228

-1.485888

0.1422

R-squared

0.226858

Mean dependent var

47.45588

Adjusted R-squared

0.190617

S. D. dependent var

93.75701

S. E. of regression

84.34914

Akaike info criterion

11.76483

Sum squared resid

455345.7

Schwarz criterion

11.89539

Log likelihood

-396.0042

Hannan-Quinn criter.

11.81656

F-statistic

6.259717

Durbin-Watson stat

2.532186

Prob(F-statistic)

0.000857

Значение вероятности высоко (выше 0,05), поэтому переменные MEROPR, HOTEL, Q, TEATR являются лишними и их можно исключить из модели. Безусловно, это не означает, что исключенные переменные не оказывают реального влияния на долю поступлений от гостиниц и ресторанов в ВРП. Однако, в контексте заданной модели и поставленной задачи, для оптимизации и улучшения модели необходимо исключить данные переменные, что мы и сделаем.

7) Проверяем модель на наличие мультиколлинеарности, предположение о которой мы делали ранее при построении корреляционной таблицы:

Проверяем такой параметр как VIF – фактор инфляции вариации.

Таблица 2.11.

Вычисление показателя VIF (фактор инфляции вариации)

1

2

3

0,05051

0,297024

0,273077

1,

1,422524

1,375662

yesno

number

income

Поскольку VIF для всех переменных не превышает 5, то мультиколлинеарность отсутствует. Мы сделали проверку уже после того, как исключили лишние переменные, поэтому, видимо, МКН была устранена.

8) Важнейшим этапом является проверка на наличие гетероскедастичности. Нулевая гипотеза – остатки гомоскедастичны. Для начала, делаем проверку с помощью специальных тестов:

Таблица 2.12.

Тест Бреуша-Пагана

Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic

7.020828

Prob. F(3,67)

0.0004

Obs*R-squared

16.98154

Prob. Chi-Square(3)

0.0007

Scaled explained SS

47.54602

Prob. Chi-Square(3)

0.0000

Таблица 2.13.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13