Можно показать (см. задачу 12.2), что, во-первых, последнее слагаемое в правой части равенства (12.4) равно нулю, т. е.

http://ok-t.ru/studopediaru/baza9/458756973160.files/image102.png 12.7

а во-вторых, второе слагаемое в правой части (12.4)

12.8

Следовательно, в качестве меры, объясняющей способности регрессора в модели (8.1'), может служить в пределах обучающей выборки (у, X) величина

http://ok-t.ru/studopediaru/baza9/458756973160.files/image103.png 12.9

Она именуется коэффициентом детерминации модели и равна доле эмпирической дисперсии переменной у, которая в рамках обучаю­щей выборки (у, X) объясняется в модели (8.1') ее регрессором х. Из равенств (12.5), (12.7) и (12.9) следует, что всегда

http://ok-t.ru/studopediaru/baza9/458756973160.files/image104.png 12.10

причем если Я2 = 1, то значения уг переменной у полностью объ­ясняются в выборке (у, X) значениями хг регрессора х, поскольку ESS = 0 и, следовательно,

http://ok-t.ru/studopediaru/baza9/458756973160.files/image105.png 12.11

Напротив, когда В? = 0, то спецификация (8.1'), очевидно, совер­шенно плоха, так как в рамках такой модели регрессор х абсолютно неспособен объяснять значения переменной у. Заметим, что ситу­ация совершенно плохой спецификации равносильна справедливо­сти статистической гипотезы (см. занятие 7)

http://ok-t.ru/studopediaru/baza9/458756973160.files/image106.png 12.12

о коэффициенте ai модели (8.1').

Выше выяснили смысл коэффициента детерминации R2 и пра­вило (12.9) его вычисления. Сейчас обратим внимание на то обстоятельство, что R2 вычисляется по выборочным данным

http://ok-t.ru/studopediaru/baza9/458756973160.files/image107.png 12.15

а следовательно, является случайной переменной. По этой причине событие R2=0

НЕ нашли? Не то? Что вы ищете?

которое может произойти, есть случайное событие (см. занятие 6). В то же время, если даже и оказывается справедливым желаемое неравенство R2˃0

то в силу опять-таки случайного характера величины R2 еще нет полного основания для отклонения гипотезы (12.12) или (12.14) о неудовлетворительной спецификации линейной модели (12.13). Нужен формализованный критерий (см. занятие 7) проверки гипо­тезы (12.14) против альтернативы Н1= Н0

 26. Связь коэффициента детерминации с коэффициентом корреляции экзогенной и эндогенной переменных модели.

Если факторные признаки различны по своей сущно­сти и/или имеют различные единицы измерения, то коэф­фициенты регрессии http://ok-t.ru/studopediaru/baza9/458756973160.files/image108.gif при разных факторах являются не­сопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с ре­зультатом, позволяющими ранжировать факторы. К ним от­носят: частные коэффициенты эластичности, β-коэффициенты, частные коэффициенты корреляции.

Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретации аналогичны линейному коэффициенту корреляции в случае однофакторной связи.

http://ok-t.ru/studopediaru/baza9/458756973160.files/image109.gif http://ok-t.ru/studopediaru/baza9/458756973160.files/image110.gif http://ok-t.ru/studopediaru/baza9/458756973160.files/image111.gif

http://ok-t.ru/studopediaru/baza9/458756973160.files/image112.gif - среднее квадратическое отклонение факторного признака;

http://ok-t.ru/studopediaru/baza9/458756973160.files/image113.gif среднее квадратическое отклонение результативного признака.

Коэффициент частной корреляции измеряет тесноту линейной связи между отдельным фактором и результатом при устранении воздействия прочих факторов модели.

Для качественной оценки тесноты связи можно использовать следующую классификацию:

0.1- 0.3- слабая связь

0.3-0.5 – умеренная связь

0.5-0.7- заметная связь

0.7-0.9- тесная связь

0.9-0.99- весьма тесная

Для расчета частных коэффициентов корреляции мо­гут быть использованы парные коэффициенты корреляции.

Для случая зависимости Y от двух факторов можно вычислить 2 коэффициента частной корреляции:

http://ok-t.ru/studopediaru/baza9/458756973160.files/image114.gif (2-ой фактор http://ok-t.ru/studopediaru/baza9/458756973160.files/image115.gif фиксирован);

http://ok-t.ru/studopediaru/baza9/458756973160.files/image116.gif (1-ый фактор http://ok-t.ru/studopediaru/baza9/458756973160.files/image117.gif фиксирован).

Это коэффициенты частной корреляции 1-ого порядка (порядок определяется числом факторов, влияние которых на результат устраняется).

Частные коэффициенты корреляции, рассчитанные по таким формулам изменяются от -1 до +1. Они используют­ся не только для ранжирования факторов модели по степени влияния на результат, но и также для отсева факторов. При малых значениях http://ok-t.ru/studopediaru/baza9/458756973160.files/image118.gif нет смысла вводить в уравнение m-ый фактор, т. к. качество уравнения регрессии при его введении возрастет незначительно (т. е. теоретиче­ский коэффициент детерминации увеличится незначитель­но).

Совокупный коэффициент множественной корреляции или индекс множественной корреляцииопределяет тесноту совместного влияния факторов на результат:

http://ok-t.ru/studopediaru/baza9/458756973160.files/image119.gif

http://ok-t.ru/studopediaru/baza9/458756973160.files/image120.gif остаточная дисперсия;

http://ok-t.ru/studopediaru/baza9/458756973160.files/image121.gif

http://ok-t.ru/studopediaru/baza9/458756973160.files/image122.gif

http://ok-t.ru/studopediaru/baza9/458756973160.files/image122.gif . Он принимает значения от 0 до 1 (в отличие от парного коэффициента корреляции, который может прини­мать отрицательные значения, R используется без учета на­правления связи). Чем плотнее фактические значения http://ok-t.ru/studopediaru/baza9/458756973160.files/image123.gif располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, больше величина http://ok-t.ru/studopediaru/baza9/458756973160.files/image124.gif . Таким образом, при значении R близком к 1, урав­нение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат; при значении Rблизком к 0 уравнение регрессии плохо описывает фактиче­ские данные и факторы оказывают слабое воздействие на результат.

При трех переменных для двух факторного уравнения регрессии данная формула совокупного коэффициента множественной корреляции легко приводится к следующему виду:

http://ok-t.ru/studopediaru/baza9/458756973160.files/image125.gif

Чем R ближе к единице, тем совокупное влияние изучаемых показателей x1 и x2 на результативный факторy больше (корреляционная связь более интенсивная).

Множественный (совокупный) коэффициент детерминации определим как квадрат множественного коэффициента корреляции. Показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Его значение - в пределах от нуля до единицы. Чем ближе множественный коэффициент детерминации к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов. http://ok-t.ru/studopediaru/baza9/458756973160.files/image126.gif

 27.Показатели качества регрессии: F-тест.

F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется как

http://ok-t.ru/studopediaru/baza9/458756973160.files/image127.png

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24