Задача.
По территориям Сибирского и Дальневосточного федеральных округов известны денежные доходы и потребительские расходы в расчете на душу населения (файл Лабораторная работа 1. Xlsx)
за июнь 2009 года
Требуется:
1) построить поле корреляции, добавить линию тренда линейного типа с выводом уравнения на график,
2) рассчитать параметры уравнения линейной регрессии, зависимости потребительских расходов от денежного дохода,
3) оценить тесноту связи с помощью показателя детерминации,
4) оценить статистическую надежность результатов регрессионного моделирования с помощью F - критерия Фишера,
5) оценить качество уравнений с помощью средней ошибки аппроксимации,
6) оценить значимость параметров регрессии с помощью t-критерия Стьюдента и путем расчета доверительного интервала каждого из показателей.
Решение (рекомендации)
В главном меню выберем Анализ данных/Регрессия.
Заполним диалоговое окно ввода данных и параметров вывода:
входной интервал Y – диапазон, содержащий данные результативного признака,
входной интервал X – диапазон, содержащий данные факторов независимого признака,
метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет,
константа – ноль – флажок, указывающая на наличие или отсутствие свободного члена в уравнении,
выходной интервал – левая верхняя ячейка диапазона вывода результатов исследования,
В итоге получим таблицу результатов исследования:

2) Из последней таблицы получаем значения коэффициентов a и b парной линейной регрессии: a=16,4047, b=-0,0001. Уравнение регрессии имеет вид y=16,4047-0,0001x.
3) Из первой таблицы имеем R2≈0,617. Таким образом, уравнением регрессии объясняется 61,7% дисперсии результативного признака, а на долю прочих факторов приходится 38,3% .
4) 1 способ.Значение F - критерия находится во второй таблице Fфакт=12,9>Fтаб(0,05;m;n-2)= Fтаб(0,05;1;8)=5,3, значит, Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения регрессии.
2 способ. По p-значению p(F) («Значимость F») делаем вывод статистической значимости уравнения регрессии:
0,007073334<
(где
-уровень значимости), значит, Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения регрессии.
5) Используя значения остатков, найдем коэффициент аппроксимации
.
Допустимые пределы средней ошибки аппроксимации 8-10%,
6) Значения t-критерия для параметров a и b возьмем из последней таблицы: ta=51,74, tb=-3,59. C помощью функции СТЬЮДРАСПОБР найдем табличное значение t-критерия tтаб(0,05;n-2). ta> tтаб, | tb |> tтаб. Если фактические значения t-критерия превышают табличное, гипотезу о несущественности коэффициентов можно отклонить.
Доверительный интервал для параметров a и b берем также из последней таблицы:
15,67351<a<17,13580; -0,00019<b<-0,00004. Таким образом, с вероятностью 0,95 параметры a и b, находясь в указанных границах, не принимают нулевых значений, не являются статистически незначимыми.


