5) Оценив вышеприведенные модели, делаем вывод, что следует всё-таки оставить модель линейной, то есть не логарифмировать. Получаем следующую регрессионную модель:
Таблица 2.9.
Выбранная регрессионная модель
Dependent Variable: YNEW | ||||
Method: Least Squares | ||||
Date: 05/18/13 Time: 18:08 | ||||
Sample (adjusted): 2 71 | ||||
Included observations: 68 after adjustments | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
YESNO | 45.50812 | 21.36355 | 2.130176 | 0.0373 |
TEATR | -0.879038 | 2.541623 | -0.345857 | 0.7307 |
Q | 0.006010 | 0.004721 | 1.273087 | 0.2079 |
NUMBER | -0.374582 | 0.324859 | -1.153059 | 0.2535 |
MEROPR | 0.003705 | 0.006039 | 0.613499 | 0.5419 |
INCOME | 0.009923 | 0.002439 | 4.068057 | 0.0001 |
HOTEL | -0.130246 | 0.308468 | -0.422233 | 0.6744 |
C | -67.12345 | 33.15462 | -2.024558 | 0.0474 |
R-squared | 0.260317 | Mean dependent var | 47.45588 | |
Adjusted R-squared | 0.174021 | S. D. dependent var | 93.75701 | |
S. E. of regression | 85.20953 | Akaike info criterion | 11.83823 | |
Sum squared resid | 435639.9 | Schwarz criterion | 12.09935 | |
Log likelihood | -394.5000 | Hannan-Quinn criter. | 11.94170 | |
F-statistic | 3.016554 | Durbin-Watson stat | 2.538939 | |
Prob(F-statistic) | 0.008777 |
6) Затем, для улучшения модели, избавляемся от лишних переменных. Для этого проделываем соответствующий тест на Redundant Variables.
Таблица 2.10.
Тест на лишние переменные
Redundant Variables: HOTEL MEROPR Q TEATR | ||||
F-statistic | 0.678514 | Prob. F(4,60) | 0.6095 | |
Log likelihood ratio | 3.008389 | Prob. Chi-Square(4) | 0.5564 | |
Test Equation: | ||||
Dependent Variable: YNEW | ||||
Method: Least Squares | ||||
Date: 05/19/13 Time: 16:46 | ||||
Sample: 2 71 | ||||
Included observations: 68 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
YESNO | 46.02572 | 20.98141 | 2.193643 | 0.0319 |
INCOME | 0.008326 | 0.002167 | 3.841418 | 0.0003 |
NUMBER | -0.344483 | 0.108612 | -3.171693 | 0.0023 |
C | -38.87420 | 26.16228 | -1.485888 | 0.1422 |
R-squared | 0.226858 | Mean dependent var | 47.45588 | |
Adjusted R-squared | 0.190617 | S. D. dependent var | 93.75701 | |
S. E. of regression | 84.34914 | Akaike info criterion | 11.76483 | |
Sum squared resid | 455345.7 | Schwarz criterion | 11.89539 | |
Log likelihood | -396.0042 | Hannan-Quinn criter. | 11.81656 | |
F-statistic | 6.259717 | Durbin-Watson stat | 2.532186 | |
Prob(F-statistic) | 0.000857 |
Значение вероятности высоко (выше 0,05), поэтому переменные MEROPR, HOTEL, Q, TEATR являются лишними и их можно исключить из модели. Безусловно, это не означает, что исключенные переменные не оказывают реального влияния на долю поступлений от гостиниц и ресторанов в ВРП. Однако, в контексте заданной модели и поставленной задачи, для оптимизации и улучшения модели необходимо исключить данные переменные, что мы и сделаем.
7) Проверяем модель на наличие мультиколлинеарности, предположение о которой мы делали ранее при построении корреляционной таблицы:
Проверяем такой параметр как VIF – фактор инфляции вариации.
Таблица 2.11.
Вычисление показателя VIF (фактор инфляции вариации)
1 | 2 | 3 |
0,05051 | 0,297024 | 0,273077 |
1, | 1,422524 | 1,375662 |
yesno | number | income |
Поскольку VIF для всех переменных не превышает 5, то мультиколлинеарность отсутствует. Мы сделали проверку уже после того, как исключили лишние переменные, поэтому, видимо, МКН была устранена.
8) Важнейшим этапом является проверка на наличие гетероскедастичности. Нулевая гипотеза – остатки гомоскедастичны. Для начала, делаем проверку с помощью специальных тестов:
Таблица 2.12.
Тест Бреуша-Пагана
Heteroskedasticity Test: Breusch-Pagan-Godfrey | |||
F-statistic | 7.020828 | Prob. F(3,67) | 0.0004 |
Obs*R-squared | 16.98154 | Prob. Chi-Square(3) | 0.0007 |
Scaled explained SS | 47.54602 | Prob. Chi-Square(3) | 0.0000 |
Таблица 2.13.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 |


