3. РЕГРЕССИОННЫЙ АНАЛИЗ
3.1. Постановка задачи регрессионного анализа
Экономические показатели функционирования предприятия (отрасли, хозяйства), как правило, представляются таблицами статистических данных:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Обычно один из экономических показателей выделяется в качестве результирующего и изучается влияние на него других показателей как факторов.
Статистические данные представляют собой выборку некоторой реализации значений случайных величин:
-
-ая реализация численного значения результата
,
;
-
-ая реализация численного значения
-ого фактора
,
,
.
Использование статистических данных позволяет добиваться оптимальных результатов, управляя величинами факторов, или прогнозировать возможную величину результата при сложившихся значениях факторов.
Между случайной величиной результата
и случайной величиной фактора
имеется стохастическая (случайная) зависимость, т. е. существует корреляционная зависимость.
Использование представленных в табличной форме статистических данных для выработки управленческих решений или прогнозов недостаточно удобно из-за их большого объема, ненаглядности и необходимости дополнительной обработки. Поэтому стремятся представить такие статистические данные в виде аналитической зависимости результата от факторов.
Таким образом, корреляционную зависимость результата от факторов, проявляющуюся приблизительно и лишь в массе наблюдений, требуется отобразить с помощью функциональной зависимости результата от факторов, проявляющуюся определенно и точно в каждом конкретном случае. Задача состоит в определении интересующей нас случайной величины результата, если случайные величины факторов, от которых статистически зависит результат, приняли конкретные значения.
Функциональная зависимость результата от факторов представляется уравнением регрессии[1].
Парная корреляция выражается зависимостью между двумя случайными величинами - результатом и одним фактором:
.
Множественная корреляция характеризует стохастическую связь между результатом и несколькими факторами:
.
Замена корреляционной зависимости на функциональную может привести к искажению отображения влияния факторов на результат. Поэтому общая задача регрессионного анализа состоит в определении такого вида и параметров уравнения регрессии, при которых наиболее точно представляется корреляционная зависимость.
При проведении регрессионного анализа необходимо выполнить, по крайней мере, пять следующих этапов:
1) выбрать функцию для построения уравнения регрессии;
2) рассчитать коэффициенты (параметры) уравнения регрессии (см. 3.2);
3) оценить надежность рассчитанных коэффициентов уравнения регрессии (см. 3.3);
4) проверить качество уравнения регрессии (см. 3.4);
5) провести экономический анализ на основе уравнения регрессии (см. 3.5).
Далее будем рассматривать только линейные уравнения регрессии и регрессионный анализ - со второго этапа.
3.2. Расчет коэффициентов уравнения регрессии
методом наименьших квадратов
Метод наименьших квадратов (МНК) может быть использован для расчета коэффициентов только линейного уравнения регрессии.
При определении коэффициентов однофакторного уравнения регрессии с помощью табличных (фактических) значений
Результат |
|
|
|
|
Фактор |
|
|
|
|
определяют регрессионные остатки, характеризующие отклонения (ошибки), с которыми линейное уравнение регрессии отображает табличную функцию:

Ясно, что чем лучше будут подобраны коэффициенты линейного уравнения регрессии, тем меньше по абсолютной величине будут отклонения. Поэтому требуется найти такие значения коэффициентов
и
, при которых сумма квадратов регрессионных остатков была бы минимальной:
.
Функция двух аргументов
принимает экстремальное значение, в данном случае минимальное, в точке
, в которой частные производные этой функции по каждому аргументу равны нулю:
,
.
После преобразования получаем систему уравнений:

Решая систему двух линейных уравнений относительно двух неизвестных
и
, определяются коэффициенты (параметры) линейного уравнения регрессии:
.
Аналогично рассчитываются коэффициенты многофакторного уравнения регрессии.
3.3. Оценивание надежности коэффициентов
уравнения регрессии
Надежность оцениваемого коэффициента при соответствующем факторе в уравнении регрессии характеризует, насколько точнее уравнение регрессии, включающее этот коэффициент, отражает случайные величины результата, чем уравнение регрессии, не включающее этот коэффициент.
Для оценки надежности коэффициентов используются:
- коэффициент частной корреляции;
- t-критерий (критерий Стъюдента).
Рассмотрим использование коэффициента частной корреляции для оценки влияния фактора
в уравнении регрессии
![]()
Пусть в результате
наблюдений имеются фактические значения, представленные в таблице:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент частной корреляции рассчитывается по формуле:

где суммы квадратов отклонений


Тогда, если
, то
, т. е. отклонения уравнения регрессии при
от фактических значений результирующего показателя
минимальны и фактор
является существенным.
Если
, то
, т. е. можно принять коэффициент
, т. к. он не способствует повышению точности.
Рассмотрим использование t-критерия Стъюдента.
Вычисление любого коэффициента
уравнения регрессии производится по данным наблюдения фактических значений результата и влияющих на него факторов (см. 3.3). Поэтому от объема выборки (
наблюдений) и точности измерения таких данных зависит правильность расчета коэффициента
Ошибка расчета такого коэффициента является случайной величиной и может быть оценена методом испытаний гипотез.
Значение t-критерия Стъюдента рассчитывается по формуле:

где
- вычисленное значение
-ого коэффициента уравнения регрессии;
- рассчитываемая ошибка определения этого коэффициента.
Сформулируем две гипотезы:
- нулевую
о том, что коэффициент ![]()
- альтернативную (конкурирующую)
о том, что коэффициент
.
Зададим вероятность допустить ошибку первого рода, т. е. отвергнуть правильную гипотезу, как уровень значимости ![]()
Из таблицы t-распределения Стьюдента для заданного уровня значимости
и числа степеней свободы
определяется значение
.
Если
, то нулевая гипотеза отвергается.
Если
, то 
3.4. Проверка качества уравнения регрессии
Проверка качества уравнения регрессии основана на сравнении точности получаемого с помощью этого уравнения отображения результирующего показателя с точностью оценок при использовании среднего значения результирующего показателя.
Рассмотрим табличную функцию:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пусть построено уравнение регрессии для этой табличной функции:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 |


