Задача.

По территориям Сибирского и Дальневосточного федеральных округов известны денежные доходы и потребительские расходы в расчете на душу населения (файл Лабораторная работа 1. Xlsx)
за июнь 2009 года

Требуется:

1)  построить поле корреляции, добавить линию тренда линейного типа с выводом уравнения на график,

2)  рассчитать параметры уравнения линейной регрессии, зависимости потребительских расходов от денежного дохода,

3)  оценить тесноту связи с помощью показателя детерминации,

4)  оценить статистическую надежность результатов регрессионного моделирования с помощью F - критерия Фишера,

5)  оценить качество уравнений с помощью средней ошибки аппроксимации,

6)  оценить значимость параметров регрессии с помощью t-критерия Стьюдента и путем расчета доверительного интервала каждого из показателей.

Решение (рекомендации)

В главном меню выберем Анализ данных/Регрессия.

Заполним диалоговое окно ввода данных и параметров вывода:

входной интервал Y – диапазон, содержащий данные результативного признака,

входной интервал X – диапазон, содержащий данные факторов независимого признака,

метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет,

константа – ноль – флажок, указывающая на наличие или отсутствие свободного члена в уравнении,

выходной интервал – левая верхняя ячейка диапазона вывода результатов исследования,

В итоге получим таблицу результатов исследования:

2)  Из последней таблицы получаем значения коэффициентов a и b парной линейной регрессии: a=16,4047, b=-0,0001. Уравнение регрессии имеет вид y=16,4047-0,0001x.

НЕ нашли? Не то? Что вы ищете?

3)  Из первой таблицы имеем R2≈0,617. Таким образом, уравнением регрессии объясняется 61,7% дисперсии результативного признака, а на долю прочих факторов приходится 38,3% .

4)  1 способ.Значение F - критерия находится во второй таблице Fфакт=12,9>Fтаб(0,05;m;n-2)= Fтаб(0,05;1;8)=5,3, значит, Но - гипотеза о случайной природе оцени­ваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения регрессии.

2 способ. По p-значению p(F) («Значимость F») делаем вывод статистической значимости уравнения регрессии:

0,007073334< (где -уровень значимости), значит, Но - гипотеза о случайной природе оцени­ваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения регрессии.

5)  Используя значения остатков, найдем коэффициент аппроксимации

.

Допустимые пределы средней ошибки аппроксимации 8-10%,

6) Значения t-критерия для параметров a и b возьмем из последней таблицы: ta=51,74, tb=-3,59. C помощью функции СТЬЮДРАСПОБР найдем табличное значение t-критерия tтаб(0,05;n-2). ta> tтаб, | tb |> tтаб. Если фактические значения t-критерия превышают табличное, гипотезу о несущественности коэффициентов можно отклонить.

Доверительный интервал для параметров a и b берем также из последней таблицы:

15,67351<a<17,13580; -0,00019<b<-0,00004. Таким образом, с вероятностью 0,95 параметры a и b, находясь в указанных границах, не принимают нулевых значений, не являются статистически незначимыми.