Основные свойства корреляционных отношений (при достаточно большом объеме выборки ):

1.  Корреляционное отношение есть неотрицательная величина, не превосходящее 1:

2.  Если то корреляционная связь отсутствует.

3.  Если то между переменными существует функциональная зависимость.

4.  т. е. в отличие от коэффициента корреляции (для которого при вычислении корреляционного отношения существенно, какую переменную считать независимой, а какую – зависимой.

Эмпирическое корреляционное отношение является показателем рассеяния

точек корреляционного поля относительно эмпирической линии регрессии, выражаемой ломаной, соединяющей значения Однако, закономерное изменение нарушается случайными зигзагами ломаной, возникающими вследствие остаточного действия неучтенных факторов, преувеличивает тесноту с вязи. Поэтому наряду с рассматривают показатель тесноты связи , характеризующий рассеяние точек корреляционного поля относительно линии регрессии . Показатель получил название теоретического корреляционного отношения или индекса корреляции по :

(8)

где дисперсии и определяются по формулам (2)-(4), в которых групповые средние заменены условными средними вычисленными по уравнению регрессии

Подобно вводится и индекс корреляции по :

(9)

Достоинством рассмотренных показателей и является то, что они могут быть вычислены при любой форме связи между переменными. Хотя и завышает тесноту связи по сравнению с , но для его вычисления не нужно знать уравнение регрессии. Корреляционные отношения и связаны с коэффициентом корреляции следующим

образом:

(10)

В случае линейной модели , индекс корреляции равен коэффициенту корреляции (по абсолютной величине): (или

.

Для доказательства введем предположение Тогда по формуле

(т. к. ). Учитывая формулы дисперсии, коэффициентов регрессии и корреляции, получим

Коэффициент детерминации равный квадрату индекса корреляции (для парной линейной модели -, показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной.

Чем ближе к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии. Если то эмпирические точки лежат на линии регрессии и между переменными X и Y существует линейная функциональная зависимость. Если то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных, и линия регрессии параллельна оси абсцисс.

Расхождение между и (или может быть использовано для проверки линейности корреляционной зависимости.

Проверка значимости корреляционного отношения основано на том, что статистика

(11)

(где число интервалов по группировочному признаку) имеет распределение Фишера-Снедекора с и степенями свободы. Поэтому значимо отличается от нуля, если где табличное значение критерия на уровне значимости при числе степеней свободы и .

Индекс корреляции двух переменных значим, если значение статистики

(12)

больше табличного , где и

Пример 5. По данным таблицы 19 вычислить корреляционное отношение и индекс корреляции и проверить их значимость на уровне

Решение. Определим . Ранее в примере 1 вычислены: общая средняя общая дисперсия групповые средние (табл. 19). Для вычисления межгрупповой дисперсии формируем таблицу 21

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28