Регрессионный анализ (стр. 1 )

3. РЕГРЕССИОННЫЙ АНАЛИЗ

3.1. Постановка задачи регрессионного анализа

Экономические показатели функционирования предприятия (отрасли, хозяйства), как правило, представляются таблицами статистических данных:

Обычно один из экономических показателей выделяется в качестве результирующего и изучается влияние на него других показателей как факторов.

Статистические данные представляют собой выборку некоторой реализации значений случайных величин:

- -ая реализация численного значения результата , ;

- -ая реализация численного значения -ого фактора , , .

Использование статистических данных позволяет добиваться оптимальных результатов, управляя величинами факторов, или прогнозировать возможную величину результата при сложившихся значениях факторов.

Между случайной величиной результата и случайной величиной фактора имеется стохастическая (случайная) зависимость, т. е. существует корреляционная зависимость.

Использование представленных в табличной форме статистических данных для выработки управленческих решений или прогнозов недостаточно удобно из-за их большого объема, ненаглядности и необходимости дополнительной обработки. Поэтому стремятся представить такие статистические данные в виде аналитической зависимости результата от факторов.

Таким образом, корреляционную зависимость результата от факторов, проявляющуюся приблизительно и лишь в массе наблюдений, требуется отобразить с помощью функциональной зависимости результата от факторов, проявляющуюся определенно и точно в каждом конкретном случае. Задача состоит в определении интересующей нас случайной величины результата, если случайные величины факторов, от которых статистически зависит результат, приняли конкретные значения.

НЕ нашли? Не то? Что вы ищете?

Функциональная зависимость результата от факторов представляется уравнением регрессии[1].

Парная корреляция выражается зависимостью между двумя случайными величинами - результатом и одним фактором:

Множественная корреляция характеризует стохастическую связь между результатом и несколькими факторами:

Замена корреляционной зависимости на функциональную может привести к искажению отображения влияния факторов на результат. Поэтому общая задача регрессионного анализа состоит в определении такого вида и параметров уравнения регрессии, при которых наиболее точно представляется корреляционная зависимость.

При проведении регрессионного анализа необходимо выполнить, по крайней мере, пять следующих этапов:

1) выбрать функцию для построения уравнения регрессии;

2) рассчитать коэффициенты (параметры) уравнения регрессии (см. 3.2);

3) оценить надежность рассчитанных коэффициентов уравнения регрессии (см. 3.3);

4) проверить качество уравнения регрессии (см. 3.4);

5) провести экономический анализ на основе уравнения регрессии (см. 3.5).

Далее будем рассматривать только линейные уравнения регрессии и регрессионный анализ - со второго этапа.

3.2. Расчет коэффициентов уравнения регрессии

методом наименьших квадратов

Метод наименьших квадратов (МНК) может быть использован для расчета коэффициентов только линейного уравнения регрессии.

При определении коэффициентов однофакторного уравнения регрессии с помощью табличных (фактических) значений

Результат
Фактор

определяют регрессионные остатки, характеризующие отклонения (ошибки), с которыми линейное уравнение регрессии отображает табличную функцию:

Ясно, что чем лучше будут подобраны коэффициенты линейного уравнения регрессии, тем меньше по абсолютной величине будут отклонения. Поэтому требуется найти такие значения коэффициентов и , при которых сумма квадратов регрессионных остатков была бы минимальной:

Функция двух аргументов принимает экстремальное значение, в данном случае минимальное, в точке , в которой частные производные этой функции по каждому аргументу равны нулю:

После преобразования получаем систему уравнений:

Решая систему двух линейных уравнений относительно двух неизвестных и , определяются коэффициенты (параметры) линейного уравнения регрессии:

Аналогично рассчитываются коэффициенты многофакторного уравнения регрессии.

3.3. Оценивание надежности коэффициентов

уравнения регрессии

Надежность оцениваемого коэффициента при соответствующем факторе в уравнении регрессии характеризует, насколько точнее уравнение регрессии, включающее этот коэффициент, отражает случайные величины результата, чем уравнение регрессии, не включающее этот коэффициент.

Для оценки надежности коэффициентов используются:

- коэффициент частной корреляции;

- t-критерий (критерий Стъюдента).

Рассмотрим использование коэффициента частной корреляции для оценки влияния фактора в уравнении регрессии

Пусть в результате наблюдений имеются фактические значения, представленные в таблице:

Коэффициент частной корреляции рассчитывается по формуле:

где суммы квадратов отклонений

Тогда, если , то , т. е. отклонения уравнения регрессии при от фактических значений результирующего показателя минимальны и фактор является существенным.

Если , то , т. е. можно принять коэффициент , т. к. он не способствует повышению точности.

Рассмотрим использование t-критерия Стъюдента.

Вычисление любого коэффициента уравнения регрессии производится по данным наблюдения фактических значений результата и влияющих на него факторов (см. 3.3). Поэтому от объема выборки ( наблюдений) и точности измерения таких данных зависит правильность расчета коэффициента Ошибка расчета такого коэффициента является случайной величиной и может быть оценена методом испытаний гипотез.

Значение t-критерия Стъюдента рассчитывается по формуле:

где - вычисленное значение -ого коэффициента уравнения регрессии;

- рассчитываемая ошибка определения этого коэффициента.

Сформулируем две гипотезы:

- нулевую о том, что коэффициент

- альтернативную (конкурирующую) о том, что коэффициент .

Зададим вероятность допустить ошибку первого рода, т. е. отвергнуть правильную гипотезу, как уровень значимости

Из таблицы t-распределения Стьюдента для заданного уровня значимости и числа степеней свободы определяется значение .

Если , то нулевая гипотеза отвергается.

Если , то

3.4. Проверка качества уравнения регрессии

Проверка качества уравнения регрессии основана на сравнении точности получаемого с помощью этого уравнения отображения результирующего показателя с точностью оценок при использовании среднего значения результирующего показателя.

Рассмотрим табличную функцию:

Пусть построено уравнение регрессии для этой табличной функции:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4

Правила пользования Сайтом
Правила публикации материалов
Политика конфиденциальности и обработки персональных данных

При перепечатке материалов ссылка на pandia.org обязательна.
Минимальная ширина экрана монитора для комфортного просмотра сайта: 1200 пикселей.
Сайт не содержит автоматически сгенерированных данных и не принимает подобные материалы.

Мы признательны за найденные неточности в материалах, опечатки, некорректное отображение элементов на странице - отправляйте на [email protected]

Результат

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы