Тема 1. Построение линейно-регрессионной модели экономического процесса.
Пусть имеются две измеренные случайные величины
и
. В результате проведения n измерений получено n пар независимых пар
. Перед исследователем экономистом ставится задача построения математической модели. Построим математическую модель представленную в виде выборочного линейного уравнения регрессии с. в.
на с. в.
(в обратном случае рассуждения проводятся аналогично).
Общий вид линейного уравнения в общем виде представляется:
(1)
Используя выборочные значения мы можем получить только оценку параметров
и
из (1), т. е. получить уравнение:
(2)
где
и
это соответственно оценки параметров k и b уравнения (1).
Обозначим через
значение величины
, соответствующее
, а через
значение оценки
, которое получается при
.
Для построение адекватной регрессионной модели экономического процесса необходимо воспользоваться методом наименьших квадратов (МНК) для этого рассмотрим разность
и построим функционал который необходимо оптимизировать относительно оценок параметров:
(3)
Используя необходимое условие экстремума, приравниваем частные производные по
и
к 0. Получаем систему уравнений для нахождения этих коэффициентов:
(4)
после преобразования получаем систему
(4/)
откуда после выражения получаем следующие значения параметров:

(5)

Аналогично находится выборочное уравнение линейной регрессии СВ. X на СВ Y,
, в котором выражения для оценок параметров
и
аналогичны выражению (5).
Для оценки связи между случайными величинами обычно используется выборочный коэффициент корреляции, который определяет меру зависимости одной случайной величины от другой. Рассмотрим выборочный эмпирический корреляционный момент
(6)
где
,
- выборочные средние (математические ожидания)
и
преобразуя (6) с учетом выражений
и
, получаем
(6/)
Выборочный коэффициент корреляции с учетом (6/) есть
(7)
где
,
- выборочные среднеквадратичные дисперсии.
(8)
Геометрический смысл линейной регрессии усреднение по всей выборочной совокупности данных.


Рис.1 Линейная регрессионная модель и регрессионные поля 1 и 2
Ко всем выше перечисленным коэффициентам рассчитанным по выборочным совокупностям, можно отметить следующие имеющие значение для экономических приложений, см. таблицу
Таблица 1
Основные статистические показатели имеющие значение в экономических приложениях
Название параметра | Обозначение | Что характеризует параметр и для чего применяется | Оптимальное значение параметра |
1.Объем выборки | m | Объем данных по фактору (размер матрицы по вертикали). Применяется для установления тенденций изменения фактора | Не менее чем в 3-5 раз больше числа факторов (nxi). С увеличением числа факторов кратность должна увеличиваться |
2.Коэффициент вариации | Vi | Уровень отклонения значений факторов то средней анализируемой совокупности | Меньше 33% |
3.Коэффициент парной корреляции | rxy | Тесноту связи между i-м фактором и функцией. Применяется для отбора факторов | Больше 0,1 |
4.Коэффициент частной корреляции | rxx | Тесноту связи между факторами. Применяется для отбора факторов | Чем меньше, тем лучше модель |
5.Коэффициент множественной корреляции | R | Тесноту связи одновременно между всеми факторами и функцией. Применяется для выбора модели | Больше 0,7 |
6. Коэффициент множественной детерминации | D | Долю влияния на функцию включенных в модель факторов. Равен квадрату коэффициента множественной корреляции | Больше 0,5 |
7.Коэффициент асимметрии | A | Степень отклонения фактического распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения | Метод наименьших квадратов может применяться при А<3 |
8.Коэффициент эксцесса | E | Плосковершинность распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения | Меньше трех |
9.Критерий Фишера | F | Математический критерий, характеризующий значимость уравнения регрессии. Применяется для выбора модели | Больше табличного значения, установленного для различных размеров матрицы и вероятностей |
10.Критерий Стьюдента | t | Существенность факторов, входящих в модель. | Больше двух (при вероятности равной 0,95) |
11.Средне-квадратическая ошибка коэффициентов регрессии | Δai | Точность полученных коэффициентов регрессии. Применяется для оценки коэффициентов регрессии | В два и более раза меньше соответствующего коэффициента регрессии |
12.Ошибка аппроксимации | E | Допуск прогноза или степень несоответствия эмпирической зависимости теоретической. Применяется для оценки адекватности (точности) модели | Меньше (точнее) ±15% |
13.Коэффициент эластичности | Эi | Показывает, на сколько процентов изменяется функция при изменении соответствующего фактора на 1%. Применяется для ранжирования факторов по их значимости | Больше 0,01 |
Пример
В магазине в течение пяти дней подсчитать число покупок товара X и товара Y. Статистика продаж бала представлена в табл.2.
Таблица 2
Статистика продаж
xi | 10 | 20 | 25 | 28 | 30 |
yi | 4 | 8 | 7 | 12 | 14 |
Построить линейную регрессионную модель экономического процесса.
С учетом выражения (5) для удобства вычислений обычно формируют таблицу промежуточных вычислений см. табл. 3.
Таблица 3
Промежуточные результаты
№ | xi | yi | xi2 | xi yi | yi2 |
1 | 10 | 4 | 100 | 40 | 16 |
2 | 20 | 8 | 400 | 160 | 64 |
3 | 25 | 7 | 625 | 175 | 49 |
4 | 28 | 12 | 784 | 336 | 144 |
5 | 30 | 14 | 900 | 420 | 196 |
| 113 | 45 | 2809 | 1131 | 469 |
Используя данные таблицы 3, вычислим коэффициенты линейно-регрессионной модели для примера №1.
коэффициенты линейно-регрессионного уравнения, относительно полученных коэффициентов получаем равнение
.
Вычислим меру зависимости или корреляционный момент.

Выборочные дисперсии вычисляем исходя из значений

,
следовательно выборочная корреляция
.
Геометрический смысл и прогнозные значения.
Рис.2 Выборочные значения и средняя модель
Получено уравнение
. Исходя из уравнения регрессии по входным значениям факторных переменных xi построим прогноз для значения xi=35 и xi=42 прогнозные значения yi соответственно будут 14,5 и 17,7.
Строим таблицу с основными (по условию задачи) и прогнозными значениями, таблица 4.
Таблица 4
Прогнозные значения (выделенные значения) по регрессионной модели
xi | 10 | 20 | 25 | 28 | 30 | 35 | 42 |
yi | 4 | 8 | 7 | 12 | 14 | 15 | 18 |
Задачи для контроля и самопроверки
Задача№1
Себестоимость 1000 м3 сжатого воздуха на заводе по годам за период с 1993 по 2000гг составила соответственно 2.1 | 2.03 | 1.95 | 2.02 | 1.86 | 1.87 | 1.83 | 1.8. Отобразить динамику изменения себестоимости выработки 1000 м3 на графике (построить полигон) и спрогнозировать значения себестоимости на 2001, 2002, 2003 гг, учитывая, что математическая модель, описывающая процесс, представлена в виде линейно-регрессионного уравнения вида
(на том же графике построить уравнение модели)?
Задача№2
Необходимо выяснить, как изменится количество продаваемого товара, продаваемого ежедневно в розницу. Статистика продаж зафиксированная в определенный момент времени составила:
Количество проданного товара в день | 28 | 29 | 34 | 35 | 37 | 37 | 41 | 46 |
Цена руб. за единицу | 30 | 31 | 25 | 26 | 22 | 24 | 16 | 12 |
Требуется изобразить данные на графике, вычислить меру зависимости (выборочную корреляцию). Построить линейно-регрессионную модель. Построить прогноз, сколько единиц товара будет продано при цене 45 руб.?
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |


