·  Модель данных линейна по \alpha и \beta (\alpha и \beta линейны по );

·  Отсутствует недоопределённость (то есть ситуация, когда упущены важные факторы) и переопределённость (то есть когда, наоборот, приняты во внимание ненужные факторы); (отсутствие коллинеарности)

·  Модель данных адекватна устройству данных (модель данных и устройство данных имеют одинаковую функциональную форму).

Устройство данных — это наблюдения случайной величины. Модель данных — это уравнение регрессии. «Иметь одинаковую функциональную форму» означает «иметь одинаковую функциональную зависимость». Например, если точки наблюдений очевидно расположены вдоль невидимой экспоненты, логарифма или любой нелинейной функции, нет смысла строить линейное уравнение регрессии.

Второе условие: все X_i детерминированы и не все равны между собой. Если все X_i равны между собой, то X_i = \bar X, и в уравнении оценки коэффициента наклона прямой в линейной модели в знаменателе будет ноль, из-за чего будет невозможно оценить коэффициенты \beta_2 и вытекающий из него \beta_1. При небольшом разбросе переменных  модель сможет объяснить лишь малую часть изменения . Иными словами, переменные не должны быть постоянными.

Третье условие: ошибки не носят систематического характера. Случайный член может быть иногда положительным, иногда отрицательным, но он не должен иметь систематического смещения ни в каком из двух возможных направлений. Если уравнение регрессии включает постоянный член (\beta_1), то это условие чаще всего выполняется автоматически, так как постоянный член отражает любую систематическую, но постоянную составляющую в , которой не учитывают объясняющие переменные, включённые в уравнение регрессии.

НЕ нашли? Не то? Что вы ищете?

Четвёртое условие: дисперсия ошибок одинакова. Одинаковость дисперсии ошибок также принято называть гомоскедастичностью. Не должно быть априорной причины для того, чтобы случайный член порождал бо́льшую ошибку в одних наблюдениях, чем в других. Так как \mathbb{E}(\varepsilon_i) = 0\ \forall i и теоретическая дисперсия отклонений \varepsilon_i равна \mathbb{E}(\varepsilon_i^2), то это условие можно записать так: \mathbb{E}(\varepsilon_i^2) = \sigma^2_{\varepsilon}\ \forall i.Одна из задач регрессионного анализа состоит в оценке стандартного отклонения случайного члена. Если рассматриваемое условие не выполняется, то коэффициенты регрессии, найденные по методу наименьших квадратов, будут неэффективны, а более эффективные результаты будут получаться путём применения модифицированного метода оценивания (взвешенный МНК или оценка ковариационной матрицы по формуле Уайта или Дэвидсона—Маккинона).

Пятое условие: \varepsilon_i распределены независимо от \varepsilon_j при i\ne j. Это условие предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Если один случайный член велик и положителен в одном направлении, не должно быть систематической тенденции к тому, что он будет таким же великим и положительным (то же можно сказать и о малых, и об отрицательных остатках). Теоретическая ковариация \sigma_{\varepsilon_i,\varepsilon_j} должна равняться нулю, поскольку \sigma_{\varepsilon_i,\varepsilon_j} = \mathbb{E} \bigl( (\varepsilon_i-\mathbb{E}(\varepsilon_i)) (\varepsilon_j-\mathbb{E}(\varepsilon_j)) \bigr) = \mathbb{E} (\varepsilon_i \varepsilon_j) - \mathbb{E}(\varepsilon_i)\cdot \mathbb{E}(\varepsilon_j) = 0. Теоретические средние для \varepsilon_i и \varepsilon_j равны нулю в силу третьего условия теоремы. При невыполнении этого условия оценки, полученные по методу наименьших квадратов, будут также неэффективны.

Выводы из теоремы:

·  Эффективность оценки означает, что она обладает наименьшей дисперсией.

·  Оценка линейна по наблюдениям Y.

·  Несмещённость оценки означает, что её математическое ожидание равно истинному значению.

19. Система нормальных уравнений и явный вид её решения при оценивании методом наименьших квадратов (МНК) линейной модели парной регрессии.

Рассмотрим механизм применения МНК на примере модели линейной парной регрессии.

http://ok-t.ru/studopediaru/baza9/458757015109.files/image528.gif

В результате оценивания данной эконометрической модели определяются оценки неизвестных коэффициентов. Метод наименьших квадратов позволяет получить такие оценки параметров a0 и a1, при которых сумма квадратов остатков минимальна:

http://ok-t.ru/studopediaru/baza9/458757015109.files/image530.gif

Для нахождения параметров функции и определения минимума функции двух переменных вычисляются частные производные этой функции по каждому из оцениваемых параметров и приравниваются к нулю.

http://ok-t.ru/studopediaru/baza9/458757015109.files/image532.gif

http://ok-t.ru/studopediaru/baza9/458757015109.files/image534.gif

Если разделить обе части каждого уравнения системы на (-2), раскрыть скобки и привести подобные члены, то получим систему нормальных уравнений для определения оценок параметров модели:

http://ok-t.ru/studopediaru/baza9/458757015109.files/image536.gif

http://ok-t.ru/studopediaru/baza9/458757015109.files/image538.gif

- Это система нормальных уравнений для определения оценок параметров модели.

Убедимся, что решение системы соответствует минимуму функции, для этого вторые производные должны быть равны нулю.

http://ok-t.ru/studopediaru/baza9/458757015109.files/image540.gif

http://ok-t.ru/studopediaru/baza9/458757015109.files/image542.gif

Что и требовалось доказать.

Далее, если решить систему нормальных уравнений, то мы получим искомые оценки неизвестных коэффициентов модели регрессии a0 и a1:

http://ok-t.ru/studopediaru/baza9/458757015109.files/image544.gif

http://ok-t.ru/studopediaru/baza9/458757015109.files/image546.gif

Вывод: указанные выше выражения позволяют по известным значениям наблюдений переменных x и у вычислить оценки параметров модели парно регрессии.

20. Ковариационная матрица оценок коэффициентов линейной модели.

КОВАРИАЦИОННАЯ МАТРИЦА

матрица, образованная из попарных смешанных вторых моментов (ковариаций) неск. случайных величин(см. Моменты случайной величины). Ковариация между компонентами 2510-239.jpg и 2510-240.jpg случайного вектора 2510-241.jpg определяется как 

2510-242.jpg

где М - математическое ожидание, а 2510-243.jpg . Очевидно, что 2510-244.jpg есть дисперсия х;.Ковариация величин xi, xj, нормированная на дисперсии 2510-245.jpg , наз. корреляции коэффициентом:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24