Тема 1. Построение линейно-регрессионной модели экономического процесса.

Пусть имеются две измеренные случайные величины и . В результате проведения n измерений получено n пар независимых пар . Перед исследователем экономистом ставится задача построения математической модели. Построим математическую модель представленную в виде выборочного линейного уравнения регрессии с. в. на с. в. (в обратном случае рассуждения проводятся аналогично).

Общий вид линейного уравнения в общем виде представляется:

(1)

Используя выборочные значения мы можем получить только оценку параметров и из (1), т. е. получить уравнение:

(2)

где и это соответственно оценки параметров k и b уравнения (1).

Обозначим через значение величины , соответствующее , а через значение оценки , которое получается при .

Для построение адекватной регрессионной модели экономического процесса необходимо воспользоваться методом наименьших квадратов (МНК) для этого рассмотрим разность и построим функционал который необходимо оптимизировать относительно оценок параметров:

(3)

Используя необходимое условие экстремума, приравниваем частные производные по и к 0. Получаем систему уравнений для нахождения этих коэффициентов:

(4)

после преобразования получаем систему

(4/)

откуда после выражения получаем следующие значения параметров:

(5)

Аналогично находится выборочное уравнение линейной регрессии СВ. X на СВ Y, , в котором выражения для оценок параметров и аналогичны выражению (5).

Для оценки связи между случайными величинами обычно используется выборочный коэффициент корреляции, который определяет меру зависимости одной случайной величины от другой. Рассмотрим выборочный эмпирический корреляционный момент

НЕ нашли? Не то? Что вы ищете?

(6)

где , - выборочные средние (математические ожидания) и преобразуя (6) с учетом выражений и , получаем

(6/)

Выборочный коэффициент корреляции с учетом (6/) есть

(7)

где , - выборочные среднеквадратичные дисперсии.

(8)

Геометрический смысл линейной регрессии усреднение по всей выборочной совокупности данных.

Рис.1 Линейная регрессионная модель и регрессионные поля 1 и 2

Ко всем выше перечисленным коэффициентам рассчитанным по выборочным совокупностям, можно отметить следующие имеющие значение для экономических приложений, см. таблицу

Таблица 1

Основные статистические показатели имеющие значение в экономических приложениях

Название параметра

Обозначение

Что характеризует параметр и для чего применяется

Оптимальное значение параметра

1.Объем выборки

m

Объем данных по фактору (размер матрицы по вертикали). Применяется для установления тенденций изменения фактора

Не менее чем в 3-5 раз больше числа факторов (nxi). С увеличением числа факторов кратность должна увеличиваться

2.Коэффициент вариации

Vi

Уровень отклонения значений факторов то средней анализируемой совокупности

Меньше 33%

3.Коэффициент парной корреляции

rxy

Тесноту связи между i-м фактором и функцией. Применяется для отбора факторов

Больше 0,1

4.Коэффициент частной корреляции

rxx

Тесноту связи между факторами. Применяется для отбора факторов

Чем меньше, тем лучше модель

5.Коэффициент множественной корреляции

R

Тесноту связи одновременно между всеми факторами и функцией. Применяется для выбора модели

Больше 0,7

6. Коэффициент множественной детерминации

D

Долю влияния на функцию включенных в модель факторов. Равен квадрату коэффициента множественной корреляции

Больше 0,5

7.Коэффициент асимметрии

A

Степень отклонения фактического распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения

Метод наименьших квадратов может применяться при А<3

8.Коэффициент эксцесса

E

Плосковершинность распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения

Меньше трех

9.Критерий Фишера

F

Математический критерий, характеризующий значимость уравнения регрессии. Применяется для выбора модели

Больше табличного значения, установленного для различных размеров матрицы и вероятностей

10.Критерий Стьюдента

t

Существенность факторов, входящих в модель.

Больше двух (при вероятности равной 0,95)

11.Средне-квадратическая ошибка коэффициентов регрессии

Δai

Точность полученных коэффициентов регрессии. Применяется для оценки коэффициентов регрессии

В два и более раза меньше соответствующего коэффициента регрессии

12.Ошибка аппроксимации

E

Допуск прогноза или степень несоответствия эмпирической зависимости теоретической. Применяется для оценки адекватности (точности) модели

Меньше (точнее) ±15%

13.Коэффициент эластичности

Эi

Показывает, на сколько процентов изменяется функция при изменении соответствующего фактора на 1%. Применяется для ранжирования факторов по их значимости

Больше 0,01

Пример

В магазине в течение пяти дней подсчитать число покупок товара X и товара Y. Статистика продаж бала представлена в табл.2.

Таблица 2

Статистика продаж

xi

10

20

25

28

30

yi

4

8

7

12

14

Построить линейную регрессионную модель экономического процесса.

С учетом выражения (5) для удобства вычислений обычно формируют таблицу промежуточных вычислений см. табл. 3.

Таблица 3

Промежуточные результаты

xi

yi

xi2

xi yi

yi2

1

10

4

100

40

16

2

20

8

400

160

64

3

25

7

625

175

49

4

28

12

784

336

144

5

30

14

900

420

196

113

45

2809

1131

469

Используя данные таблицы 3, вычислим коэффициенты линейно-регрессионной модели для примера №1.

коэффициенты линейно-регрессионного уравнения, относительно полученных коэффициентов получаем равнение .

Вычислим меру зависимости или корреляционный момент.

Выборочные дисперсии вычисляем исходя из значений

, следовательно выборочная корреляция .

Геометрический смысл и прогнозные значения.

 

Рис.2 Выборочные значения и средняя модель

Получено уравнение . Исходя из уравнения регрессии по входным значениям факторных переменных xi построим прогноз для значения xi=35 и xi=42 прогнозные значения yi соответственно будут 14,5 и 17,7.

Строим таблицу с основными (по условию задачи) и прогнозными значениями, таблица 4.

Таблица 4

Прогнозные значения (выделенные значения) по регрессионной модели

xi

10

20

25

28

30

35

42

yi

4

8

7

12

14

15

18

Задачи для контроля и самопроверки

Задача№1

Себестоимость 1000 м3 сжатого воздуха на заводе по годам за период с 1993 по 2000гг составила соответственно 2.1 | 2.03 | 1.95 | 2.02 | 1.86 | 1.87 | 1.83 | 1.8. Отобразить динамику изменения себестоимости выработки 1000 м3 на графике (построить полигон) и спрогнозировать значения себестоимости на 2001, 2002, 2003 гг, учитывая, что математическая модель, описывающая процесс, представлена в виде линейно-регрессионного уравнения вида (на том же графике построить уравнение модели)?

Задача№2

Необходимо выяснить, как изменится количество продаваемого товара, продаваемого ежедневно в розницу. Статистика продаж зафиксированная в определенный момент времени составила:

Количество проданного товара в день

28

29

34

35

37

37

41

46

Цена руб. за единицу

30

31

25

26

22

24

16

12

Требуется изобразить данные на графике, вычислить меру зависимости (выборочную корреляцию). Построить линейно-регрессионную модель. Построить прогноз, сколько единиц товара будет продано при цене 45 руб.?

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12