2016-2017 Учебный год
Эконометрика и ЭММ
Семинар (6): Анализ общего качества модели. Спецификация эконометрических моделей.
Задача 1.
Таблица содержит пространственные данные выборки, описывающей топ-40 телевизионных рынков:
Y | sub = The number of subscribers of each system (in thousands) | Количество абонентов одной из 40 систем (сетей), тыс. человек |
X1 | home = The number of homes passed by each system | Количество домой, обслуживаемых (охваченных) сетью |
X2 | inst = Installation fee in dollars | Стоимость установки, дол. |
X3 | svc = Monthly service charge of each system | Ежемесячная плата за обслуживание |
X4 | tv = The number of television signals carried by each cable system | Число ТВ-сигналов, передаваемых кабельной сетью |
X5 | age = The age of each system in years | Возраст (время работы) каждой системы, лет |
X6 | air = The number of free television signals received | Число бесплатных ТВ-сигналов, передаваемых кабельной сетью |
X7 | y = Per capita income for each television market with cable, in dollars | Доход на душу населения для каждого телевизионного рынка, дол. |
Для общего развития можно ознакомиться с основными понятиями экономики телевидения и структурой Top 100 Television Markets и т. п.
(a) Проведите анализ корреляции для каждой пары показателей. Найдите значения коэффициентов парной корреляции показателей, а также вычислите значение частных коэффициентов корреляции для двух множеств: {Y, X1, X2, X3, X4, X5, X6, X7} и {X1, X2, X3, X4, X5, X6, X7} (используйте соответственно две матрицы парных коэффициентов корреляции 8х8 и 7х7, найдите обратные к ним матрицы и вычислите соответствующие частные коэффициенты корреляции по формулам).
Справка.
В практикуме смотрим нахождение частных коэффициентов корреляции на с.125-127 (п.2 в методах выявления).
Также можно начать разбирать пример применения различных методов для выявления мультиколлинеарности в модели множественной линейной регрессии.
(b) Оцените параметры модели регрессии эндогенной переменной Y=sub, используя в качестве экзогенных переменных все остальные показатели выборки. Проанализируйте качество регрессионной модели и проинтерпретируйте полученные результаты. Сопоставьте для каждой экзогенной переменной значения парного и частного коэффициента корреляции с Y, значение доверительной вероятности P значимости коэффициента регрессии при этой переменной.
(A) 
(c) Возможно ли предположить наличие в модели проблемы мультиколлинеарности? Используйте для подтверждения наличия или отсутствия в модели мультиколлинеарности найденные в пункте (а) значения парных и частных коэффициентов корреляции. Подтвердите полученный вывод с помощью метода инфляционных факторов.
(d) Последовательно исключите из исходной модели экзогенные переменные так, чтобы коэффициенты модели были статистически значимыми, получив модель (В). Сопоставьте результаты с выводами по предыдущим пунктам. Проверьте обоснованность исключения переменных с помощью F-теста. Можете также убедиться, что ошибки в модели отсутствуют как минимум по результатам теста Рамсея.
(e) Для полученной в пункте (d) модели регрессии проверьте гипотезу
.
(f) Проведите расширенный вариант MWD-теста для выбора между линейной и логарифмической моделью. Допустим в модели в пункте (d) осталось три экзогенных переменных, некоторые
(просто при проверке замените на свои переменные
):
(B) 
Находим оцененные значения эндогенной переменной по линейной модели и логарифм этих значений
(C) 
Находим оцененные значения эндогенной переменной по логарифмической модели и экспонента этих значений
Выбор между линейной и логарифмической моделью осуществляем на основании выводов о статистической значимости коэффициентов
во вспомогательных моделях (D) и (E):
(D) 
(E) 


