2. Математическое ожидание возмущения
равна нулю:
(iii)
(или математическое ожидание зависимой переменной
равно линейной функции регрессии: ![]()
![]()
3. Дисперсия возмущения
(или зависимой переменной
постоянна для любого ![]()
(iiii)
(или
условие равноизменчивости возмущения (зависимой переменной)).
4. Возмущения
и
(или переменные
и
) не коррелированы:
(iiiii)
5. Возмущение
(или зависимая переменная
) есть нормально распределенная случайная величина.
Для получения уравнения регрессии достаточно первых четырех предпосылок.
Требование выполнения пятой предпосылки необходимо для оценки точности уравнения регрессии и его параметров.
Оценкой модели (ii) по выборке является уравнение регрессии
Параметры этого уравнения
и
определяются на основе метода наименьших квадратов, который будет изложен ниже.
Воздействие нучтенных случайных факторов и ошибок наблюдений в модели (ii)
определяется с помощью дисперсии возмущений (ошибок) или остаточной дисперсии
Несмещенной оценкой этой дисперсии является выборочная остаточная дисперсия
(*)
где
групповая средняя, найденная по уравнению регрессии;
выборочная оценка возмущений
или остаток регрессии.
В знаменателе выражения (*) стоит число степеней свободы
а не
так как две степени свободы теряются при определении двух параметров прямой
и ![]()
Данные о статистической зависимости признаков
и
удобно задавать в виде корреляционной таблицы.
Рассмотрим в качестве примера зависимость между суточной выработкой продукции
(т) и величиной основных производственных фондов (ОПФ)
(млн. руб.) для совокупности 50 однотипных предприятий (табл. 19).
Таблица 19
Величина ОПФ (млн. руб) | Середины интервалов | Суточная выработка продукции, т (Y) | Всего
| Групповая средняя, т
| ||||
7-11 | 11-15 | 15-19 | 19-23 | 23-27 | ||||
9 | 13 | 17 | 21 | 25 | ||||
20-25 25-30 30-35 35-40 40-45 | 22,5 27,5 32,5 37,5 42,5 | 2 3 - - - | 1 6 3 1 - | - 4 11 2 - | - - 7 6 1 | - - - 2 1 | 3 13 21 11 2 | 10,3 13,3 17,8 20,3 23,0 |
Всего | 5 | 11 | 17 | 14 | 3 | 50 | - | |
Групповая средняя | 25,5 | 29,3 | 31,9 | 35,4 | 39,2 | - | - |
(В таблице
и
- середины соответствующих интервалов,
и
- соответственно их частоты).
На рис. 17 и 18 представлены эмпирические линии регрессии (групповых средних) в системах координат Y по Х и Х по У соответстенно.

Рис.17

Рис. 18
В таблице групповые средние по
и
вычислены соответственно по формулам:
(5) и
, (6) где
частоты пар
и 
число интервалов по переменной ![]()
число интервалов по переменной ![]()
По виду ломаных можно предположить наличие линейной корреляционной зависимости
по
и
по
между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки
(*)
Поэтому уравнение регрессии (3) будем искать в виде:
![]()
(7)
Методом наименьших квадратов (МНК) найдем формулы расчета неизвестных параметров
и
уравнения линейной регрессии (7).
Согласно МНК неизвестные параметры
и
выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних
, вычисленных по формуле (6), от значений
найденных по уравнению регрессии (6), была минимальной:
. (8)
На основании необходимого условия экстремума функции двух переменных
приравниваем к нулю ее частные производные, т. е.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |


