Пример 2
По территориям региона приводятся данные за 199Х г. (табл. 2).;
Таблица 2.
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х | Среднедневная заработная плата, руб., у |
1 | 78+N | 133+M |
2 | 82-N | 148+M |
3 | 87+M | 134-K |
4 | 79-M | 154-K |
5 | 89+K | 162+N |
6 | 106-K | 195+N |
7 | 67+M | 139-K |
8 | 88-M | 158-K |
9 | 73+N | 152+M |
10 | 87-N | 162+M |
11 | 76+K | 159-N |
12 | 115-K | 173-N |
Требуется:
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Решение
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу (табл. 1.7).
Таблица 1.7
x | х | y | ух | x2 | y2 |
|
| Ai |
1 | 78 | 133 | 10374 | 6084 | 17689 | 149 | -16 | 12,0 |
2 | 82 | 148 | 12136 | 6724 | 21904 | 152 | -А | 2,7 |
3 | 87 | 134 | 11658 | 7569 | 17956 | 157 | -23 | 17,2 |
4 | 79 | 154 | 12166 | 6241 | 23716 | 150 | 4 | 2,6 |
5 | 89 | 162 | 14418 | 7921 | 26244 | 159 | 3 | 1,9 |
6 | 106 | 195 | 20670 | 11236 | 38025 | 174 | 21 | 10,8 |
7 | 67 | 139 | 9313 | 4489 | 19321 | 139 | 0 | 0,0 |
8 | 88 | 158 | 13904 | 7744 | 24964 | 158 | 0 | 0,0 |
9 | 73 | 152 | 11096 | 5329 | 23104 | 144 | 8 | 5,3 |
10 | 87 | 162 | 14094 | 7569 | 26244 | 157 | 5 | 3,1 |
11 | 76 | 159 | 12084 | 5776 | 25281 | 147 | 12 | 7,5 |
12 | 115 | 173 | 19895 | 13225 | 29929 | 183 | -10 | 5,8 |
Итого | 1027 | 1869 | 161808 | 89907 | 294377 | 1869 | 0 | 68,8 |
Среднее значение | 85,6 | 155,8 | 13484,0 | 7492,3 | 24531,4 | X | X | 5,7 |
а | 12,95 | 16,53 | X | X | X | X | X | X |
О2 | 167,7 | 273,4 | X | X | X | X | X | X |
![]()
![]()
Получено уравнение регрессии:
. С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:

Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х - среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:
![]()
Качество построенной модели оценивается как хорошее, так как А не превышает 8 - 10%.
3. Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Выдвигаем гипотезу H0 о статистически незначимом отличии показателей от нуля:

tтабл для числа степеней свободы
и
составит 2,23.
Определим случайные ошибки
:
![]()
.
Тогда

Фактические значения t-статистики превосходят табличные значения:

поэтому гипотеза H0 отклоняется, т. е. a, b и
не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительный интервал для а и b. Для этого определим предельную ошибку для каждого показателя:
![]()
Доверительные интервалы:






Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью
параметры а и b, находясь в указанных границах, не принимают нулевых значений, т. е. не являются статистически незначимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
тыс. руб. тогда прогнозное значение прожиточного минимума составит:
тыс. руб.
5. Ошибка прогноза составит:
тыс. руб.
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
![]()
Доверительный интервал прогноза:
![]()
руб.;
руб.
Выполненный прогноз среднемесячной заработной платы оказался надежным (
=1-
=1-0,05=0,95), и достаточно точным, так как диапазон верхней и нижней границ доверительного интервала D
составляет 1,95 раза:
D
=
![]()
![]()
![]()
![]()
Пример 3
По группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции y от факторов, приведенных в табл. 1.8.
Таблица 1.8
Признак - фактор | Уравнение парной регрессии | Среднее значение фактора |
Объем производства, млн руб., |
|
|
Трудоемкость единицы продукции, чел.-час, |
|
|
Оптовая цена за 1 т энергоносителя, млн руб., |
|
|
Доля прибыли, изымаемой государством, %, |
|
|
Требуется: 
1. Определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат.
2. Ранжировать факторы по силе влияния.
Решение
1.Для уравнения равносторонней гиперболы ![]()

![]()
![]()
Для уравнения прямой ![]()
![]()
Для уравнения степенной зависимости 

![]()
Для уравнения показательной зависимости
2.Сравнивая значения
, ранжируем
по силе их влияния на себестоимость единицы продукции:
а)
в)
б)
г)![]()
Для формирования уровня себестоимости продукции группы предприятий первоочередное значение имеют цены на энергоносители; в гораздо меньшей степени влияет трудоемкость продукции и отчисляемая часть прибыли. Фактором снижения себестоимости выступает размер производства : c ростом его на1 % себестоимость единицы продукции снижается на -0,97.
Пример 4
Зависимость потребления продукта А от среднедушевого дохода по данным 20 семей характеризуется следующим образом :
уравнение регрессии ![]()
индекс корреляции ![]()
остаточная
дисперсия 
Требуется:
Провести дисперсионный анализ полученных результатов.
Решение
Результаты дисперсионного анализа приведены в табл. 1.9.
Таблица1.9
Вариация результата | Число степеней свободы | Сумма квадратов отклонения | Дисперсия на одну степень свободы, D |
|
|
Общая |
| 6,316 | - | - | - |
Факторная |
| 5,116 | 5,116 | 76,7 | 4,41 |
Остаточная |
| 1,200 | 0,0667 | - | - |
![]()
![]()
![]()
![]()
В силу того что ![]()
![]()
гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость потребления продукта А от среднедушевого дохода.


