Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
Федеральное агенство связи
Сибирский Государственный Университет Телекоммуникации и Информатики
Межрегиональный центр переподготовки специалистов
Контрольная работа
по дисциплине
«Эконометрика»
Выполнила:
Группа: ФКТ – 21
Вариант:1
Проверил:
Новосибирск 2014
Содержание
Описание данных и задание ……………………………………………....3
Задание 1 …………………………………………………………………...5
Задание 2 …………………………………………………………………...7
Описание данных и задание
Рассматривается модель линейной регрессии ;Y — зависимая переменная; X j — факторы регрессии; i — номер наблюдения; действуют стандартные предположения линейной регрессии;
Задание 1. Оценка параметров регрессии МНК, базовая «инференция» о модели (t-критерий, F-критерий), базовый анализ остатков модели. Проделайте необходимые расчеты в среде MATRIXER, приведите их результаты и прокомментируйте согласно пунктам 1.1. — 1.5. задания.
1.1. Оцените параметры линейной регрессии МНК;
1.2. Оцените значимость каждого фактора в отдельности по t-критерию;
1.3. Оцените совместную значимость всех факторов по F-критерию;
1.4. Проверка гетероскедастичности остатков (используйте результаты оценивания, приведенные в базовых статистиках уравнения в среде MATRIXER);
1.5. Проверка нормальности остатков (используйте результаты оценивания, приведенные в базовых статистиках уравнения в среде MATRIXER);
Задание 2. Проверка ряда гипотез о модели с помощью классических критериев, основанных на оценках регрессии МНК с ограничениями. Следуйте комментариям к пунктам 2.1. — 2.4., развернуто ответьте на все заданные вопросы.
2.1. Проверить совместную значимость факторов X1, X3;
Постройте вспомогательную регрессию, не включающую в себя переменные X 1 и X 3 . Сравните регрессии (исходную и вспомогательную) по сумме квадратов остатков, постройте F - Статистику для проверки существенности ограничений. Сколько ограничений в данном случае проверяется? Какая из регрессий является регрессией без ограничений, а какая с учетом ограничений? Каково значение статистики и РДУЗ? Каков результат теста и его интерпретация?
2.2. RESET тест Рамсея;
После оценки исходного уравнения регрессии сохраните в отдельную переменную расчетные значения зависимой переменной (скрытая матрица \ Fitted , дайте ей новое имя) и постройте вспомогательную регрессию, в которой факторами являются не только переменные X 1 — X 3 , но и квадрат и куб расчетных значений исходного уравнения. Постройте F -статистику для проверки совместной значимости добавленных факторов. Сколько ограничений в данном случае проверяется? Какая из регрессий является регрессией без ограничений, а какая с учетом ограничений? Каково значение статистики и РДУЗ? Каков результат теста и его интерпретация?
2.3. Проверка постоянства коэффициентов тестом Чоу I формы (выборку делить пополам)
Создайте вспомогательную переменную (назовите ее, скажем, Chow _ Break ), и задайте ей значения (можно в ручную редактированием в среде MATRIXER, а можно предварительно создать переменную в среде Excel, а затем скопировать в MATRIXER ) — переменная принимает значение 1 для первой половины наблюдений, а для второй половины наблюдений — значение 0.
Оцените вспомогательную регрессию, в которой вместо исходных факторов X 1, X 2, X 3 участвует набор факторов X 1* Chow _ Break, X 2* Chow _ Break, X 3* Chow _ Break, X 1*(1- Chow _ Break ), X 2*(1- Chow _ Break ), X 3*(1- Chow _ Break ). Создавать новые факторы не обязательно, достаточно указать их формулы непосредственно в строке команд при записи команды для оценки регрессии МНК.
Сравните полученную вспомогательную и исходную регрессии, постройте F - статистику для проверки равенства коэффициентов при «разных половинах» исходных факторов во вспомогательной регрессии. Сколько ограничений в данном случае проверяется? Какая из регрессий является регрессией без ограничений, а какая с учетом ограничений? Каково значение статистики и РДУЗ? Каков результат теста и его интерпретация?
2.4. Проверка гетероскедастичности (тест Бреуша – Годфри – Пагана);
После оценки исходной регрессии сохраните в отдельную переменную остатки из уравнения (скрытая матрица \ Resids, дайте ей новое имя, например, Resid 1 ) и рассчитайте квадрат остатков (введите в командное окно команду R esid2:= R esid1^2 и нажмите «Выполнить», теперь в переменной Resid 2 — квадраты остатков исходного уравнения).
Создайте вспомогательную регрессию, где в качестве зависимой выступает переменная Resi d2 , а факторы — исходный набор факторов, номер наблюдения (для него придется создать отдельную переменную, либо используйте интерактивную переменную $ i ) , квадраты факторов (также подумайте, какие еще переменные можно добавить в эту регрессию). Оцените вклад каждого из этих факторов в зависимую переменную, есть ли между ней и какими-либо факторами существенная корреляция? Проверьте совместную значимость всех факторов в этой вспомогательной регрессии, при необходимости удалите незначимые факторы и переоцените уравнение. Какова интерпретация результата? Как можно использовать результаты этого теста?
Задание 1
В среде MATRIXER создадим импортом матрицу Matrix.
Выводим результаты:
Обычный метод наименьших квадратов (линейная регрессия)
Зависимая переменная: Matrix[Y]
Количество наблюдений: 480
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 Константа 215.36559699 5.4625588597 39.425771422 [0.0000]
2 Matrix[X1] 2.3617526903 0.2469560781 9.5634523688 [0.0000]
3 Matrix[X2] 2.3254607794 0.1713473071 13.571621399 [0.0000]
4 Matrix[X3] -0.2111770388 0.1108405497 -1.9052326914 [0.0574]
R^2adj. = 35.402944004% DW = 1.9492
R^2 = 35.807518468% S. E. = 25.489902124
Сумма квадратов остатков: 309273.912490196
Максимум логарифмической функции правдоподобия: -2233.45765773899
AIC = 9.3227402406 BIC = 9.3575217914
F(3,476) = 88.50662 [0.0000]
Нормальность: Chi^2(2) = 16.20353 [0.0003]
Гетероскедастичность: Chi^2(1) = 0.65384 [0.4187]
Функциональная форма: Chi^2(1) = 2.304024 [0.1290]
AR(1) в ошибке: Chi^2(1) = 0.298304 [0.5849]
ARCH(1) в ошибке: Chi^2(1) = 2.950418 [0.0859]
1.1. Оценка параметров линейной регрессии МНК
R2 (коэффициент детерминации) равен 35.807518468%, то есть не менее 35,8% вариации результирующего признака Y объясняется вариацией регрессоров X1, X2, Х3.
Нормированный R-квадрат (35.402944004%) – скорректированный коэффициент детерминации.
Сумма квадратов остатков (это RSS, необходимый для построения ряда статистики в классических критериях проверки гипотез об оценках) = 309273.912490196.
1.2. Оценка значимости каждого фактора в отдельности по t-критерию
По результатам видно, что реально достигнутый уровень значимости (РДУЗ) напротив всех факторов, кроме Х3 достаточно мал (составляет менее любого из стандартных приемлемых уровней допустимой вероятности ошибки первого уровня — 0.1, 0.05 и даже 0.01). РДУЗ напротив фактора Х3 составил 0,0574, то есть фактор значим при уровне допустимой вероятности ошибки первого уровня 0.1.
Оценка значимости факторов в отдельности по t-критерию позволяет сделать вывод, что в модели значимы все факторы при уровне допустимой вероятности ошибки первого уровня 0.1. При уровне допустимой вероятности ошибки первого уровня 0.05 и менее значимы факторы Х1 и Х2.
1.3. Оценка совместной значимости всех факторов по F-критерию
Фактическое значение F-критерия, равное 88.50662 свидетельствует о статистической значимости уравнения регрессии в целом. F - статистика имеет (3, 476) степеней свободы (по количеству факторов и количеству наблюдений – количество факторов – 1). Нулевая гипотеза о совместной незначимости факторов в уравнении в данном случае отвергается, т. к. РДУЗ слишком мал (не отличим от 0 при округлении до 4 знаков после десятичной точки, это меньше любого разумного критического уровня значимости).
1.4. Проверка гетероскедастичности остатков
Гетероскедастичность: Chi^2(1) = 0.65384 [0.4187];
Критерий Годфрея автокорреляции остатков: AR(1) в ошибке: Chi^2(1) = 0.298304 [0.5849];
Критерий авторегрессионной условной гетероскедастичности в ошибках: ARCH(1) в ошибке: Chi^2(1) = 2.950418 [0.0859].
Делаем вывод о том, что определить гетероскедастичность в модели не удалось (РДУЗ составил более 0.4)
1.5. Проверка нормальности остатков
Основная гипотеза состоит в том, что остатки действительно являются реализацией нормально распределенной случайной величины, РДУЗ составил 0.0003, т. е. гипотезу отвергаем (стандартным уровнем допустимой вероятности ошибки первого рода в таком критерии можно считать 0.05), остатки не являются нормально распределенными.
Задание 2
2.1. Проверка совместной значимости факторов X1, X3
Построим вспомогательную регрессию, не включающую в себя переменные X1 и X3.
Результаты построения и анализа:
Обычный метод наименьших квадратов
(линейная регрессия)
Зависимая переменная: Matrix[Y]
Количество наблюдений: 480
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 Константа 256.92870913 1.4669286141 175.1473839 [0.0000]
2 Matrix[X2] 2.2182524296 0.1871180973 11.854825705 [0.0000]
R^2adj. = 22.559186718% DW = 2.0040
R^2 = 22.720858562% S. E. = 27.909159505
Сумма квадратов остатков: 372324.326087608
Максимум логарифмической функции правдоподобия: -2277.98677445969
AIC = 9.4999448936 BIC = 9.517335669
F(1,478) = 140.5369 [0.0000]
Нормальность: Chi^2(2) = 3.713811 [0.1562]
Гетероскедастичность: Chi^2(1) = 0.330998 [0.5651]
Функциональная форма: Chi^2(1) = 3.321851 [0.0684]
AR(1) в ошибке: Chi^2(1) = 0.002118 [0.9633]
ARCH(1) в ошибке: Chi^2(1) = 2.102416 [0.1471]
Сумма квадратов остатков во вспомогательной матрице составляет ≈ 372324, что на 63050 или в 1,2 раза больше, чем в исходной (≈309274). Очевидно, из этого следует вывод о сильной зависимости Y от переменных X1 и Х3 (которые во вспомогательной матрице не учитывали).
Для проверки существенности ограничений в исходной регрессии используем «Критерий удаления переменных», где выбираем Х1 и Х3.
F-статистика для проверки существенности ограничений: F(2,476) = 48.52009 [0.0000] Нулевая гипотеза состоит в существенности ограничений (одновременное равенство нулю коэффициентов при выбранных переменных), малое значение РДУЗ говорит, что гипотезу следует отвергнуть, т. е. данная группа факторов значима и не может быть исключена.
2.2. RESET тест Рамсея
Построим вспомогательную регрессию, в которой факторами являются не только переменные X 1 — X 3 , но и квадрат и куб расчетных значений исходного уравнения.
Обычный метод наименьших квадратов
(линейная регрессия)
Зависимая переменная: Matrix[Y]
Количество наблюдений: 480
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 Константа -3551.6928406 2954.128823 -1.2022809611 [0.2299]
2 Matrix[X1] -68.998071798 54.645452015 -1.2626498501 [0.2073]
3 Matrix[X2] -67.974480645 53.843494732 -1.262445556 [0.2074]
4 Matrix[X3] 6.1644550048 4.8830023063 1.2624313113 [0.2074]
5 Yras^2 0.1104450708 0.0875556555 1.2614270348 [0.2078]
6 Yras^3 -1.338274E-04 1.100221E-04 -1.216367216 [0.2245]
R^2adj. = 35.642645755% DW = 1.9542
R^2 = 36.314434421% S. E. = 25.442565192
Сумма квадратов остатков: 306831.634571503
Максимум логарифмической функции правдоподобия: -2231.55490009138
AIC = 9.323145417 BIC = 9.3753177433
F(5,474) = 54.05634 [0.0000]
Нормальность: Chi^2(2) = 13.75468 [0.0010]
Гетероскедастичность: Chi^2(1) = 0.331534 [0.5648]
Функциональная форма: Chi^2(1) = 6.202471 [0.0128]
AR(1) в ошибке: Chi^2(1) = 0.245729 [0.6201]
ARCH(1) в ошибке: Chi^2(1) = 3.083977 [0.0791]
Сумма квадратов остатков составляет ≈ 306832.
Отличие от исходной (309274) составляет 2442, то есть менее 1%.
Таким образом добавочные факторы совместно незначимы, т. е. связь между X и Y ограничена линейной формой.
Для проверки существенности добавлены факторов во вспомогательной регрессии используем «Критерий удаления переменных», где выбираем Yras^2 и Yras^3.
F(2,474) = 1.886441 [0.1527]
Нулевая гипотеза состоит в существенности ограничений (одновременное равенство нулю коэффициентов при выбранных переменных), большое значение РДУЗ (в нашем случае более 0.15) говорит, что гипотезу отвергнуть не удается, т. е. данная группа факторов (добавленные факторы) незначима и может быть исключена.
2.3. Проверка постоянства коэффициентов тестом Чоу I формы
Создадим вспомогательную переменную (Chow) — переменная принимает значение 1 для первой половины наблюдений, а для второй половины наблюдений — значение 0.
Построим вспомогательную регрессию, в которой вместо исходных факторов X 1, X 2, X 3 участвует набор факторов X 1* Chow, X 2* Chow, X 3* Chow, X 1*(1 – Chow), X 2*(1 – Chow), X 3*(1 – Chow).
Обычный метод наименьших квадратов (линейная регрессия)
Зависимая переменная: Matrix[Y]
Количество наблюдений: 480
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 Константа 215.32504372 5.474455981 39.332683369 [0.0000]
2 Matrix[X1]*Chow 2.2117720254 0.2697981354 8.1978773572 [0.0000]
3 Matrix[X2]*Chow 2.4497345004 0.2424764455 10.102979263 [0.0000]
4 Matrix[X3]*Chow -0.1436449669 0.1449456914 -0.9910261254 [0.3222]
5 Matrix[X1]*(1-Chow) 2.5088567386 0.2749822686 9.1237036889 [0.0000]
6 Matrix[X2]*(1-Chow) 2.2351155758 0.2395065869 9.3321674557 [0.0000]
7 Matrix[X3]*(1-Chow) -0.2856670024 0.1555200981 -1.8368494218 [0.0669]
R^2adj. = 35.279758771% DW = 1.9475
R^2 = 36.090450728% S. E. = 25.514194903
Сумма квадратов остатков: 307910.768942705
Максимум логарифмической функции правдоподобия: -2232.3975051033
AIC = 9.3308229379 BIC = 9.3916906519
F(6,473) = 44.51808 [0.0000]
Нормальность: Chi^2(2) = 17.35366 [0.0002]
Гетероскедастичность: Chi^2(1) = 0.929092 [0.3351]
Функциональная форма: Chi^2(1) = 2.225139 [0.1358]
AR(1) в ошибке: Chi^2(1) = 0.320845 [0.5711]
ARCH(1) в ошибке: Chi^2(1) = 2.040281 [0.1532]
В данном случае исходная регрессия – это регрессия с учетом ограничений, а вспомогательная – без ограничений.
Сумма квадратов остатков составляет ≈ 307911, отличие от исходной (309274) составляет 1363, то есть менее 1%.
В данной модели F(6,473) = 44.51808.
Основная гипотеза формулируется как утверждение о том, что качество общей модели регрессии без ограничений лучше качества частных моделей регрессии или подвыборок.
Альтернативная или обратная гипотеза утверждает, что качество общей модели регрессии без ограничений хуже качества частных моделей регрессии или подвыборок
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия (как в нашем случае), то основная гипотеза отклоняется, и качество частных моделей регрессии превосходит качество общей модели регрессии.
Построим F-статистику для проверки равенства коэффициентов при «разных половинах» исходных факторов во вспомогательной регрессии.
F(3,473) = 59.31711 [0.0000]
F(3,473) = 56.39177 [0.0000]
Нулевая гипотеза состоит в существенности ограничений (одновременное равенство нулю коэффициентов при выбранных переменных), малое значение РДУЗ говорит, что гипотезу следует отвергнуть, т. е. каждая половина факторов во вспомогательной регрессии значима и не может быть исключена.
2.4. Проверка гетероскедастичности (тест Бреуша – Годфри – Пагана)
Создадим вспомогательную регрессию, где в качестве зависимой выступает переменная Resid2 (квадрат остатков), а факторы — исходный набор факторов, номер наблюдения, квадраты факторов.
Обычный метод наименьших квадратов
(линейная регрессия)
Зависимая переменная: Resid2
Количество наблюдений: 480
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 Константа -835.3409531 891.94785834 -0.9365356341 [0.3495]
2 Matrix[X1] 119.76103692 95.309368924 1.2565505183 [0.2095]
3 Matrix[X2] 7.1173731562 10.803218102 0.6588197229 [0.5103]
4 Matrix[X3] 12.921174955 17.59923673 0.7341895079 [0.4632]
5 Matrix[NN] 1.3093361435 0.3431491092 3.8156477998 [0.0002]
6 Matrix[X1]^2 -3.0043216312 2.4625781918 -1.2199903504 [0.2231]
7 Matrix[X2]^2 -0.4914789306 1.1138375009 -0.4412483241 [0.6592]
8 Matrix[X3]^2 -0.4308366431 0.4702619926 -0.916163011 [0.3600]
R^2adj. = 2.2475369335% DW = 1.9121
R^2 = 3.6760697966% S. E. = 1038.5649523
Сумма квадратов остатков: 509107299.583939
Максимум логарифмической функции правдоподобия: -4010.9424766775
AIC = 16.745593653 BIC = 16.815156755
F(7,472) = 2.573318 [0.0130]
Нормальность: Chi^2(2) = 3389.509 [0.0000]
Гетероскедастичность: Chi^2(1) = 12.7749 [0.0004]
Функциональная форма: Chi^2(1) = 0.196516 [0.6575]
AR(1) в ошибке: Chi^2(1) = 0.923336 [0.3366]
ARCH(1) в ошибке: Chi^2(1) = 1.76749 [0.1837]
В данной модели все факторы, за исключением номера наблюдений незначимы по результатам t-статистики.
Так как F(7,472) = 2.573318 [0.0130], то гипотезу о правильности спецификации данной модели следует отклонить.


