Формы корреляционной связи:

по направлению – прямые и обратные связи. При прямой связи с увеличением (уменьшением) значений факторного признака X происходит увеличение (уменьшение) значений результативного признака Y. При обратной связи с увеличением (уменьшением) значений X происходит уменьшение (увеличение) значений Y. по аналитическому выражению – линейные (Y=a0+a1X) и нелинейные (например, Y=a0+a1ln X) связи. по количеству изучаемых признаков – парные и множественные связи.

Корреляционно-регрессионный анализ включает в себя измерение тесноты, направления связи и установление аналитической формы связи. Корреляционный анализ имеет своей задачей количественное измерение тесноты связи двух или большего числа признаков между собой. Регрессионный анализ заключается в нахождении регрессионного уравнения, выражающего зависимость средних значений результативного признака Y от значений одного или нескольких факторных признаков.

8.2. Методы измерения корреляционной связи

8.2.1. Измерение тесноты корреляционной связи двух количественных признаков

Для измерения тесноты (силы) связи двух количественных показателей могут применяться следующие показатели.

1) линейный коэффициент корреляции Пирсона

.        (8.1)

Он принимает значения в интервале от –1 до +1. Если величины Y и X независимы, то коэффициент корреляции rxy=0. Положительные значения rxy указывают на прямую связь, отрицательные – на обратную. Если rxy=±1, то Y и X связаны линейной функциональной зависимостью Y=a0+a1X.

НЕ нашли? Не то? Что вы ищете?

На рис. 8.1 приведены примеры диаграмм рассеяния пар значений X и Y. Случаи а), б) и в) наглядно демонстрируют, что коэффициент корреляции rxy позволяет измерить именно линейную корреляционную связь. Напротив, случаи г) и д) показывают, что когда признаки X и Y связаны нелинейно, использование линейного коэффициента корреляции rxy некорректно.

Для проверки гипотезы о существенности (значимости) коэффициента корреляции можно использовать t-критерий Стьюдента. Для этого рассчитывают значение t-критерия по формуле

                               (8.2)

Если , то гипотеза о том, что rxy=0 отвергается при уровне значимости ?. Значение tкр берется из таблицы распределения Стьюдента при уровне значимости ?  и числе степеней свободы n–2.

Рис. 8.1. Примеры диаграмм рассеяния признаков X и Y и соответствующих коэффициентов корреляции

Для расчета доверительного интервала оценки коэффициента корреляции можно использовать z-преобразование Р. Фишера

                               (8.3)

Величина z имеет приблизительно нормальное распределение, поэтому доверительный интервал для z имеет вид [z–t?sz, z+t?sz], где sz – средняя ошибка величины z.

.                                (8.4)

Коэффициент доверия t находят из таблицы распределения Стьюдента при заданной доверительной вероятности ?  и числе степеней свободы ?. Обратный пересчет z в rxy производят по формуле

,                (8.5)

где tanh(?) – гиперболический тангенс.

Все выше изложенное справедливо, если совместное распределение X и Y является нормальным.

Для качественной характеристики силы связи может использоваться шкала Чэддока (см. п.4.3).

2) Коэффициент детерминации ?2 и выборочное корреляционное отношение ?.

Для оценки тесноты линейной корреляционной связи служит коэффициент корреляции rxy. Для оценки тесноты нелинейной корреляционной связи можно использовать выборочное корреляционное отношение Y к X

,                (8.6)

где – межгрупповая дисперсия признака Y; – внутригрупповая дисперсия; – общая дисперсия (см. п.4.3).

, , , .

Аналогично определяется выборочное корреляционное отношение Х к Y

.

Рис. 8.1. Примеры диаграмм рассеяния признаков X и Y и соответствующих корреляционных отношений

Свойства выборочного корреляционного отношения ?yx.

0??yx?1. Если ?yx=0, то признак Y с признаком Х корреляционной зависимостью не связан. Если ?yx=1, то признак Y связан с признаком Х функциональной зависимостью. |ryx|??yx. Если ?yx=|ryx|, то имеет место точная линейная корреляционная зависимость.

3) Коэффициент Фехнера

,

где С – число пар совпадающих знаков разностей () и (); Н – число пар несовпадающих знаков.

8.2.2. Измерение тесноты корреляционной связи двух качественных признаков

Для измерения тесноты связи между качественными признаками могут быть использованы коэффициенты ранговой корреляции при условии, что значения признаков могут быть проранжированы (упорядочены) в порядке убывания или возрастания.

Для расчета ранговых коэффициентов корреляции необходимо упорядочить пары значений (xi, yi), например, в порядке возрастания для признака Х. Затем значения xi,, yi заменяют их рангами Rxi, Ryi. Ранг – это порядковый номер объекта в ранжированном ряде. Если объекты имеют одинаковое значение признака, то каждому из них приписывают ранг, равный среднему арифметическому порядковых номеров объектов.

1) Коэффициент ранговой корреляции Спирмэна

.                        (8.7)

2) Коэффициент ранговой корреляции Кендалла.

,                                        (8.8)

где ;

Отметим, что ранговые коэффициенты корреляции принимают значения в интервале от –1 до +1. Кроме того, они позволяют измерять тесноту связи не только качественных, но и количественных признаков.

Если качественные признаки являются альтернативными, принимающими только два взаимоисключающих значения, то для определение тесноты связи могут быть использованы:

3) Коэффициент ассоциации Юла-Кендэла.

4) Коэффициент контингенции Пирсона.

Рассмотрим четырехклеточную корреляционную  таблицу (таблицу «четырех полей») с частотами a, b, c, d.

Признак Y – да

Признак Y – нет

Признак X – да

a

b

Признак X – нет

c

d

Коэффициент ассоциации имеет вид

.                                        (8.9)

Коэффициент контингенции выражается формулой

.                        (8.10)

Коэффициенты ассоциации и контингенции изменяются от –1 до +1. Выполняется неравенство KA ?KK. Таким образом, коэффициент ассоциации завышает значение корреляции. Связь считается существенной, если ?KK??0,3 или ?KА??0,5.

Если качественный признак представлен более чем двумя группами, то  можно использовать:

5) Коэффициент взаимной сопряженности Пирсона.

6) Коэффициент взаимной сопряженности .

Для расчета коэффициентов взаимной сопряженности необходимо рассчитать показатель взаимной сопряженности ? 2

,                        (8.11)

где K1, K2 – число возможных значений X и Y соответственно; fij – частота клетки в таблице распределения; mi, nj – итоговые частоты соответствующих строк и столбцов, , (см. пример 8.3).

Тогда коэффициент взаимной сопряженности Пирсона

.                                (8.12)

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23