2.4 Проверка качества уравнения регрессии
2.4.1 Вопросы для обсуждения:
Перечислите предпосылки МНК. Каковы последствия их выполнимости либо невыполнимости? В чем суть наилучших линейных несмещенных оценок (BLUE)? Как определяются стандартные ошибки регрессии и коэффициентов регрессии? Опишите схему проверки гипотез о величинах коэффициентов регрессии. В чем суть статистической значимости коэффициентов регрессии? Опишите «грубое» правило анализа статистической значимости коэффициентов регрессии. Приведите схему определения интервальных оценок коэффициентов регрессии. Как строится и что позволяет определить доверительный интервал для условного математического ожидания зависимой переменной? В чем суть предсказания индивидуальных значений зависимой переменной? Объясните суть коэффициента детерминации. В каких пределах изменяется коэффициент детерминации?2.4.2 Пример решения задач. По данным задачи из предыдущей темы (2.3.2) рассчитаем 95%-и доверительный интервал для условного математического ожидания M(Y|X = xp) при Х= 160. Определим границы интервала:

Таким образом, доверительный интервал для среднего значения Y при X = 160 имеет вид: (149,728; 156,5193). Другими словами, среднее потребление при доходе 160 с вероятностью 95% будет находиться в интервале (149,728; 156,5193).
Рассчитаем границы интервала, в котором будет сосредоточено не менее 95% возможных объемов потребления при неограниченно большом числе наблюдений и уровне дохода X = 160.

Тогда интервал, в котором будут находиться, по крайней мере, 95% индивидуальных объемов потребления при доходе X = 160, имеет вид: (147,4898; 158,7082). Нетрудно заметить, что он включает в себя доверительный интервал для условного среднего потребления.
Рассчитаем коэффициент детерминации R2

Столь высокое значение коэффициента детерминации свидетельствует о высоком общем качестве построенного уравнения регрессии. R = 0,983 ≈ (0,9914) = r2xy (неточности в данном случае связаны с округлением вычислений).
2.4.3 Задачи и упражнения для самостоятельного решения.
1) Имеются данные за 10 лет по прибылям X и Y (в %) двух компаний:
X | 19,2 | 15,8 | 12,5 | 10,3 | 5,7 | -5,8 | -3,5 | 5,2 | 7,3 | 6,7 |
Y | 20,1 | 18,0 | 10,3 | 12,5 | 6,0 | -6,8 | -2,8 | 3,0 | 8,5 | 8,0 |
а) Постройте регрессионную модель Y = b0 + b1X + e.
б) Оцените статистическую значимость коэффициентов регрессии.
в) Оцените коэффициент детерминации R2 данного уравнения.
г) Постройте регрессионную модель Y = bХ + и.
д) Приведите формулы расчета коэффициента b, его стандартной ошибки Sb и стандартной ошибки регрессии S (обратите внимание на число степеней свободы при расчете данной оценки).
е) Значимо или нет различаются коэффициенты b1 и b?
ж) Какую из построенных моделей вы предпочтете?
з) Можно ли на основе построенных регрессий утверждать, что прибыль одной из компаний является следствием прибыли другой?
2) Пусть имеются следующие наблюдения за переменными X и Y:
X | 0 0 2 2 |
Y | 0 2 0 2 |
а) Постройте эмпирическое уравнение регрессии Y = b0 + b1X + e и изобразите его на корреляционном поле.
б) Постройте эмпирическое уравнение регрессии Y = bХ + х и изобразите его на корреляционном поле.
в) Рассчитайте коэффициенты детерминации для обоих уравнений.
г) Каковы выводы из построенных моделей?
3) Пусть построена следующая регрессия: Ŷ = 150 + 5Х, R2 = 0,87,
se = (20) (1,2)
где хt = zt / zt-1 – темп роста показателя Z.
Как изменится регрессия, если в качестве переменной X использовать темп прироста показателя Z (%): xt = (zt – zt-i) / zt-1.
2.4.4 Литература: [8], [9], [10], [11], [12], [13], [14], [15].


