Лабораторная работа 2
По территориям региона приводятся данные за 199Х г.
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х | Среднедневная заработная плата, руб., у |
1 | 78+N | 133+N |
2 | 82-N | 148+N |
3 | 87+N | 134-N |
4 | 79-N | 154-N |
5 | 89+N | 162+N |
6 | 106-N | 195+N |
7 | 67+N | 139-N |
8 | 88-N | 158-N |
9 | 73+N | 152+N |
10 | 87-N | 162+N |
11 | 76+N | 159-N |
12 | 115-N | 173-N |
Требуется:
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции, среднюю ошибку аппроксимации.
3. Оценить статистическую значимость уравнения в целом и параметров регрессии и корреляции.
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Решение
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу
№ | х | y | ух | x2 | y2 |
|
|
|
|
1 | 78 | 133 | 10374 | 6084 | 17689 | 149 | -16 | 256 | 12,0 |
2 | 82 | 148 | 12136 | 6724 | 21904 | 152 | -4 | 16 | 2,7 |
3 | 87 | 134 | 11658 | 7569 | 17956 | 157 | -23 | 529 | 17,2 |
4 | 79 | 154 | 12166 | 6241 | 23716 | 150 | 4 | 16 | 2,6 |
5 | 89 | 162 | 14418 | 7921 | 26244 | 159 | 3 | 9 | 1,9 |
6 | 106 | 195 | 20670 | 11236 | 38025 | 174 | 21 | 441 | 10,8 |
7 | 67 | 139 | 9313 | 4489 | 19321 | 139 | 0 | 0 | 0,0 |
8 | 88 | 158 | 13904 | 7744 | 24964 | 158 | 0 | 0 | 0,0 |
9 | 73 | 152 | 11096 | 5329 | 23104 | 144 | 8 | 64 | 5,3 |
10 | 87 | 162 | 14094 | 7569 | 26244 | 157 | 5 | 25 | 3,1 |
11 | 76 | 159 | 12084 | 5776 | 25281 | 147 | 12 | 144 | 7,5 |
12 | 115 | 173 | 19895 | 13225 | 29929 | 183 | -10 | 100 | 5,8 |
Итого | 1027 | 1869 | 161808 | 89907 | 294377 | 1869 | 0 | 1600 | 68,9 |
Среднее значение | 85,6 | 155,8 | 13484,0 | 7492,3 | 24531,4 | 5,7 | |||
| 12,84 | 16,05 | |||||||
| 164,94 | 257,76 |


Получено уравнение регрессии:
. С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
![]()
Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х - среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:
![]()
Качество построенной модели оценивается как хорошее, так как А не превышает 8 - 10%.
3.Рассчитаем F - критерий.
![]()
,
.
-гипотеза о статистической незначимости уравнения регрессии отклоняется.
Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Выдвигаем гипотезу H0 о статистически незначимом отличии показателей от нуля:
![]()
tтабл для числа степеней свободы
и
составит 2,23.
Определим случайные ошибки
:
![]()
.
Тогда

Фактические значения t-статистики превосходят табличные значения:
![]()
поэтому гипотеза H0 отклоняется, т. е. a, b и
не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительный интервал для а и b. Для этого определим предельную ошибку для каждого показателя:
![]()
Доверительные интервалы:
![]()
![]()



Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью
параметры а и b, находясь в указанных границах, не принимают нулевых значений, т. е. не являются статистически незначимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
тыс. руб. тогда прогнозное значение среднедневной заработной платы составит:
тыс. руб.
5. Ошибка прогноза составит:

тыс. руб.
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
![]()
Доверительный интервал прогноза:
![]()
руб.;
руб.
2 способ.
При выполнении лабораторной работы можно использовать программу Excel (Сервис, Анализ данных, Регрессия).
В результате получим таблицу вида
Таблица 1
Регрессионная статистика | ||||||
Множественный R | 0, | |||||
R-квадрат | 0, | |||||
Нормированный R-квадрат | 0, | |||||
Стандартная ошибка | 12,5495908 | |||||
Наблюдения | 12 | |||||
Таблица 2 | ||||||
Дисперсионный анализ | ||||||
df | SS | MS | F | Значимость F | ||
Регрессия | 1 | 1705,327706 | 1705,327706 | 10, | 0, | |
Остаток | 10 | 1574,922294 | 157,4922294 | |||
Итого | 11 | 3280,25 | ||||
Таблица 3 | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | |
Y-пересечение | 76,9764852 | 24, | 3, | 0, | 23, | 130,9232056 |
Переменная X 1 | 0, | 0, | 3, | 0, | 0, | 1, |
ВЫВОД ОСТАТКА |
| |||||
Таблица 4 |
| |||||
Наблюдение | Предсказанное Y | Остатки |
| |||
1 | 148,7700683 | -15, |
| |||
2 | 152,4517905 | -4, |
| |||
3 | 157,0539433 | -23, |
| |||
4 | 149,6904989 | 4, |
| |||
5 | 158,8948044 | 3, |
| |||
6 | 174,5421238 | 20, |
| |||
7 | 138,6453322 | 0, |
| |||
8 | 157,9743738 | 0, |
| |||
9 | 144,1679155 | 7, |
| |||
10 | 157,0539433 | 4, |
| |||
11 | 146,9292072 | 12,0707928 |
| |||
12 | 182,8259988 | -9, |
| |||
В использование таблицы Вам поможет цветовая схема
Пункт 1. Параметры линейного уравнения парной регрессии y от x расположены в таблице 3.
Пункт 2. Коэффициент корреляции находится в таблице 1. Для нахождения средней ошибки аппроксимации можно использовать столбец остатков из таблицы 4.
Пункт 3. Фактическое значение F-критерия находится в таблице 2, а t-статистика – в таблице 3.
Пункт 4. Прогнозное значение подсчитывается подстановкой интересуемого значения x в уравнение регрессии.
Пункт 5. Значение Sост, используемое в формуле для подсчета ошибки прогноза расположено в таблице 1.


