Тема 1. Построение линейно-регрессионной модели экономического процесса.
Пусть имеются две измеренные случайные величины
и
. В результате проведения n измерений получено n пар независимых пар
. Перед исследователем экономистом ставится задача построения математической модели. Построим математическую модель представленную в виде выборочного линейного уравнения регрессии с. в.
на с. в.
(в обратном случае рассуждения проводятся аналогично).
Общий вид линейного уравнения в общем виде представляется:
(1)
Используя выборочные значения мы можем получить только оценку параметров
и
из (1), т. е. получить уравнение:
(2)
где
и
это соответственно оценки параметров k и b уравнения (1).
Обозначим через
значение величины
, соответствующее
, а через
значение оценки
, которое получается при
.
Для построение адекватной регрессионной модели экономического процесса необходимо воспользоваться методом наименьших квадратов (МНК) для этого рассмотрим разность
и построим функционал который необходимо оптимизировать относительно оценок параметров:
(3)
Используя необходимое условие экстремума, приравниваем частные производные по
и
к 0. Получаем систему уравнений для нахождения этих коэффициентов:
(4)
после преобразования получаем систему
(4/)
откуда после выражения получаем следующие значения параметров:

(5)

Аналогично находится выборочное уравнение линейной регрессии СВ. X на СВ Y,
, в котором выражения для оценок параметров
и
аналогичны выражению (5).
Для оценки связи между случайными величинами обычно используется выборочный коэффициент корреляции, который определяет меру зависимости одной случайной величины от другой. Рассмотрим выборочный эмпирический корреляционный момент
(6)
где
,
- выборочные средние (математические ожидания)
и
преобразуя (6) с учетом выражений
и
, получаем
(6/)
Выборочный коэффициент корреляции с учетом (6/) есть
(7)
где
,
- выборочные среднеквадратичные дисперсии.
(8)
Геометрический смысл линейной регрессии усреднение по всей выборочной совокупности данных.


Рис.1 Линейная регрессионная модель и регрессионные поля 1 и 2
Ко всем выше перечисленным коэффициентам рассчитанным по выборочным совокупностям, можно отметить следующие имеющие значение для экономических приложений, см. таблицу
Таблица 1
Основные статистические показатели имеющие значение в экономических приложениях
|
Название параметра |
Обозначение |
Что характеризует параметр и для чего применяется |
Оптимальное значение параметра |
|
1.Объем выборки |
m |
Объем данных по фактору (размер матрицы по вертикали). Применяется для установления тенденций изменения фактора |
Не менее чем в 3-5 раз больше числа факторов (nxi). С увеличением числа факторов кратность должна увеличиваться |
|
2.Коэффициент вариации |
Vi |
Уровень отклонения значений факторов то средней анализируемой совокупности |
Меньше 33% |
|
3.Коэффициент парной корреляции |
rxy |
Тесноту связи между i-м фактором и функцией. Применяется для отбора факторов |
Больше 0,1 |
|
4.Коэффициент частной корреляции |
rxx |
Тесноту связи между факторами. Применяется для отбора факторов |
Чем меньше, тем лучше модель |
|
5.Коэффициент множественной корреляции |
R |
Тесноту связи одновременно между всеми факторами и функцией. Применяется для выбора модели |
Больше 0,7 |
|
6. Коэффициент множественной детерминации |
D |
Долю влияния на функцию включенных в модель факторов. Равен квадрату коэффициента множественной корреляции |
Больше 0,5 |
|
7.Коэффициент асимметрии |
A |
Степень отклонения фактического распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения |
Метод наименьших квадратов может применяться при А<3 |
|
8.Коэффициент эксцесса |
E |
Плосковершинность распределения случайных наблюдений от нормального (по центру) распределения. Применяется для проверки нормальности распределения |
Меньше трех |
|
9.Критерий Фишера |
F |
Математический критерий, характеризующий значимость уравнения регрессии. Применяется для выбора модели |
Больше табличного значения, установленного для различных размеров матрицы и вероятностей |
|
10.Критерий Стьюдента |
t |
Существенность факторов, входящих в модель. |
Больше двух (при вероятности равной 0,95) |
|
11.Средне-квадратическая ошибка коэффициентов регрессии |
Δai |
Точность полученных коэффициентов регрессии. Применяется для оценки коэффициентов регрессии |
В два и более раза меньше соответствующего коэффициента регрессии |
|
12.Ошибка аппроксимации |
E |
Допуск прогноза или степень несоответствия эмпирической зависимости теоретической. Применяется для оценки адекватности (точности) модели |
Меньше (точнее) ±15% |
|
13.Коэффициент эластичности |
Эi |
Показывает, на сколько процентов изменяется функция при изменении соответствующего фактора на 1%. Применяется для ранжирования факторов по их значимости |
Больше 0,01 |
Пример
В магазине в течение пяти дней подсчитать число покупок товара X и товара Y. Статистика продаж бала представлена в табл.2.
Таблица 2
Статистика продаж
|
xi |
10 |
20 |
25 |
28 |
30 |
|
yi |
4 |
8 |
7 |
12 |
14 |
Построить линейную регрессионную модель экономического процесса.
С учетом выражения (5) для удобства вычислений обычно формируют таблицу промежуточных вычислений см. табл. 3.
Таблица 3
Промежуточные результаты
|
№ |
xi |
yi |
xi2 |
xi yi |
yi2 |
|
1 |
10 |
4 |
100 |
40 |
16 |
|
2 |
20 |
8 |
400 |
160 |
64 |
|
3 |
25 |
7 |
625 |
175 |
49 |
|
4 |
28 |
12 |
784 |
336 |
144 |
|
5 |
30 |
14 |
900 |
420 |
196 |
|
|
113 |
45 |
2809 |
1131 |
469 |
Используя данные таблицы 3, вычислим коэффициенты линейно-регрессионной модели для примера №1.
коэффициенты линейно-регрессионного уравнения, относительно полученных коэффициентов получаем равнение
.
Вычислим меру зависимости или корреляционный момент.

Выборочные дисперсии вычисляем исходя из значений

,
следовательно выборочная корреляция
.
Геометрический смысл и прогнозные значения.
Рис.2 Выборочные значения и средняя модель
Получено уравнение
. Исходя из уравнения регрессии по входным значениям факторных переменных xi построим прогноз для значения xi=35 и xi=42 прогнозные значения yi соответственно будут 14,5 и 17,7.
Строим таблицу с основными (по условию задачи) и прогнозными значениями, таблица 4.
Таблица 4
Прогнозные значения (выделенные значения) по регрессионной модели
|
xi |
10 |
20 |
25 |
28 |
30 |
35 |
42 |
|
yi |
4 |
8 |
7 |
12 |
14 |
15 |
18 |
Задачи для контроля и самопроверки
Задача№1
Себестоимость 1000 м3 сжатого воздуха на заводе по годам за период с 1993 по 2000гг составила соответственно 2.1 | 2.03 | 1.95 | 2.02 | 1.86 | 1.87 | 1.83 | 1.8. Отобразить динамику изменения себестоимости выработки 1000 м3 на графике (построить полигон) и спрогнозировать значения себестоимости на 2001, 2002, 2003 гг, учитывая, что математическая модель, описывающая процесс, представлена в виде линейно-регрессионного уравнения вида
(на том же графике построить уравнение модели)?
Задача№2
Необходимо выяснить, как изменится количество продаваемого товара, продаваемого ежедневно в розницу. Статистика продаж зафиксированная в определенный момент времени составила:
|
Количество проданного товара в день |
28 |
29 |
34 |
35 |
37 |
37 |
41 |
46 |
|
Цена руб. за единицу |
30 |
31 |
25 |
26 |
22 |
24 |
16 |
12 |
Требуется изобразить данные на графике, вычислить меру зависимости (выборочную корреляцию). Построить линейно-регрессионную модель. Построить прогноз, сколько единиц товара будет продано при цене 45 руб.?
Задача№3
Было проведено социальное исследование, были получены сведения о том, сколько зарабатывает население за месяц и сколько при этом каждый человек откладывает на «черный день». Для девяти случайно отобранных людей была получена следующая статистика:
|
Доход тыс. руб. в месяц |
15 |
6 |
9 |
3 |
20 |
11 |
14 |
10 |
12 |
|
Сбережения |
2000 |
200 |
500 |
500 |
2500 |
1800 |
1500 |
1500 |
1600 |
Требуется вычислить коэффициенты линейной регрессии, изобразить выборочные данные и уравнение на графике. Измерить тесноту линейной связи?
Задача№4
Одну из туристических фирм заинтересовал вопрос связи между числом посетителей отелей и расходами на их рекламу. Отделом маркетинга фирмы случайным образом для исследования было выбрано шесть отелей сходным по экономическим показателям. Была собрана следующая информация:
|
Отель |
1 |
2 |
3 |
4 |
5 |
6 |
|
Расходы на рекламу |
9000 |
6000 |
10000 |
8000 |
7000 |
4000 |
|
Число посетителей |
1100 |
1200 |
1600 |
1300 |
1100 |
800 |
Построить модель маркетингового исследования. Оценить на сколько зависит число посетителей от расходов на рекламу?
Задача№5
Была собрана коммерческая информация по 12 магазинам. Перед аналитическим отделом поставлена задача оценка связи между годовой прибылью и оборотом денежных активов. Для анализа была представлена следующая информация:
|
Магазин |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
Годовая прибыль |
2 |
4 |
11 |
17 |
18 |
28 |
34 |
36 |
48 |
55 |
71 |
85 |
|
Оборот |
50 |
60 |
85 |
85 |
100 |
120 |
140 |
155 |
180 |
210 |
250 |
300 |
Постройте модель зависимости между прибылью и оборотом.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 |


