2.4  Проверка качества уравнения регрессии


2.4.1 Вопросы для обсуждения:

Перечислите предпосылки МНК. Каковы последствия их выполнимости либо невыполнимости? В чем суть наилучших линейных несмещенных оценок (BLUE)? Как определяются стандартные ошибки регрессии и коэффициентов регрессии? Опишите схему проверки гипотез о величинах коэффициентов регрессии. В чем суть статистической значимости коэффициентов регрессии? Опишите «грубое» правило анализа статистической значимости коэффициентов регрессии. Приведите схему определения интервальных оценок коэффициентов регрессии. Как строится и что позволяет определить доверительный интервал для условного математического ожидания зависимой переменной? В чем суть предсказания индивидуальных значений зависимой переменной? Объясните суть коэффициента детерминации. В каких пределах изменяется коэффициент детерминации?

2.4.2 Пример решения задач. По данным задачи из предыдущей темы (2.3.2) рассчитаем 95%-и доверительный интервал для условного математического ожидания M(Y|X = xp) при Х= 160. Определим границы интервала:

Таким образом, доверительный интервал для среднего значения Y при X = 160 имеет вид: (149,728; 156,5193). Другими словами, среднее потребление при доходе 160 с вероятностью 95% будет находиться в интервале (149,728; 156,5193).

Рассчитаем границы интервала, в котором будет сосредоточено не менее 95% возможных объемов потребления при неограниченно большом числе наблюдений и уровне дохода X = 160.

Тогда интервал, в котором будут находиться, по крайней мере, 95% индивидуальных объемов потребления при доходе X = 160, имеет вид: (147,4898; 158,7082). Нетрудно заметить, что он включает в себя доверительный интервал для условного среднего потребления.

Рассчитаем коэффициент детерминации R2

Столь высокое значение коэффициента детерминации свидетельствует о высоком общем качестве построенного уравнения регрессии. R = 0,983 ≈ (0,9914) = r2xy (неточности в данном случае связаны с округлением вычислений).

2.4.3 Задачи и упражнения для самостоятельного решения.

1) Имеются данные за 10 лет по прибылям X и Y (в %) двух компаний:


X

19,2

15,8

12,5

10,3

5,7

-5,8

-3,5

5,2

7,3

6,7

Y

20,1

18,0

10,3

12,5

6,0

-6,8

-2,8

3,0

8,5

8,0


а)        Постройте регрессионную модель Y = b0 + b1X + e.

б)        Оцените статистическую значимость коэффициентов регрессии.

в)        Оцените коэффициент детерминации R2 данного уравнения.

г)        Постройте регрессионную модель Y = bХ + и.

д)        Приведите формулы расчета коэффициента b, его стандартной ошибки Sb и стандартной ошибки регрессии S (обратите внимание на число степеней свободы при расчете данной оценки).

е)        Значимо или нет различаются коэффициенты b1 и b?

ж)        Какую из построенных моделей вы предпочтете?

з)        Можно ли на основе построенных регрессий утверждать, что прибыль одной из компаний является следствием прибыли другой?

2) Пусть имеются следующие наблюдения за переменными X и Y:


X

  0  0  2  2

Y

  0  2  0  2


а)        Постройте эмпирическое уравнение регрессии Y = b0 + b1X + e и изобразите его на корреляционном поле.

б)        Постройте эмпирическое уравнение регрессии Y = bХ + х и изобразите его на корреляционном поле.

в)        Рассчитайте коэффициенты детерминации для обоих уравнений.

г)        Каковы выводы из построенных моделей?

3) Пусть построена следующая регрессия: Ŷ = 150 + 5Х,  R2 = 0,87,

se =  (20)  (1,2)

где хt = zt / zt-1 – темп роста показателя Z.

Как изменится регрессия, если в качестве переменной X использовать темп прироста показателя Z (%): xt = (zt – zt-i) / zt-1.

2.4.4 Литература: [8], [9], [10], [11], [12], [13], [14], [15].