9.7. Ранговая корреляция

До сих пор мы анализировали зависимости между количественными переменными, измеренными в так называемых количественных шкалах, т. е. в шкалах с непрерывным множеством значений, позволяющих выявить, на сколько (или во сколько раз) проявление признака у одного объекта больше (меньше), чем у другого (например, производительность труда, себестоимость продукции, темп роста и т. п.).

Но на практике часто встречаются с необходимостью изучения связи между ординальными (порядковыми) переменными, измеренными в так называемой порядковой шкале. В этой шкале можно установить лишь порядок, в котором объекты выстраиваются по степени проявления признака (например, качество жилищных условий, тестовые баллы, экзаменационные оценки и т. п.). Например, если по некоторой дисциплине два студента имеют оценки «отлично» и «удовлетворительно», то можно лишь утверждать, что уровень подготовки по этой дисциплине первого студента выше, чем второго, но нельзя сказать, на сколько и во сколько раз больше.

В таких случаях проблема оценки тесноты связи разрешима, если упорядочить, или ранжировать, объекты анализа по степени выраженности измеряемых признаков. При этом каждому объекту приписывается определенный номер, называемый рангом. Например, объекту с наименьшим проявлением (значением) признака приписывается ранг 1, следующему за ним – ранг 2 и т. д. Объекты можно рас полагать и в порядке убывания проявления (значения) признака. Если объекты ранжированы по двум признакам, то имеется возможность оценить тесноту связи между признаками, основываясь на рангах, т. е. тесноту ранговой корреляции.

НЕ нашли? Не то? Что вы ищете?

Коэффициент ранговой корреляции Спирмена находится по формуле:

(1)

где и ранги го объекта по переменным и , число пар наблюдений по переменным и .

Если ранги всех объектов равны ( то по формуле (1) т. е. имеет место полная прямая связь. При полной обратной связи, когда ранги объектов по двум переменным расположены в обратном порядке, можно показать, что и по формуле (1) Во всех остальных случаях

Следует иметь в виду, что поскольку коэффициент Спирмена учитывает разность только рангов, а не самих переменных и , он менее точен по сравнению с линейным коэффициентом. Поэтому его крайние значения (1 или 0) нельзя безоговорочно расценивать как свидетельство функциональной связи или полного отсутствия зависимости между и . Расчет формулы (1) очень простой и поэтому имеет предпочтение, особенно на начальном этапе выявления наличия связи между изучаемыми показателями.

Формула (1) применима строго теоретически только тогда, когда отдельные значения и , а следовательно, и их ранги не повторяются. Для случая повторяющихся (связанных) рангов есть другая, более сложная формула, скорректированная на число повторяющихся рангов. Однако опыт показывает, что результаты расчетов по скорректированной формуле для связанных рангов мало отличаются от результатов, полученных по формуле для неповторяющихся рангов. Поэтому на практике формула (1) успешно применяется как для неповторяющихся, так и для повторяющихся рангов.

При проверке значимости исходят из того, что в случае справедливости нулевой гипотезы об отсутствии корреляционной связи между переменными при статистика

(2)

имеет распределение Стьюдента с степенями свободы. Поэтому значим на уровне если фактически наблюдаемое значение будет больше критического (по абсолютной величине), т. е. где табличное значение критерия Стьюдента, определенное на уровне значимости при числе степеней свободы .

Пример 7. Рассмотрим связь между индивидуальными показателями готовности к школе, полученными до начала обучения в школе у 11 первоклассников и их средней успеваемостью в конце учебного года.

Решение. Для решения задачи были проранжированы, во-первых, значения

показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем (см. табл. 22).

Таблица 22

№ учащегося

1

2

3

4

5

6

7

8

9

10

11

Ранги показателей школьной готовности

3

5

6

1

4

11

9

2

8

7

10

Ранги среднегодовой успеваемости

2

7

8

3

4

6

11

1

10

5

9

1

-2

-2

-2

0

5

-2

1

-2

2

1

1

4

4

4

0

25

4

1

4

4

1

Подставляя полученные данные в формулу (1), получим

Для проверки значимости по формуле (2) вычислим и найдем по табл. 6 приложений (критерий Стъюдента) для

Так как то ранговый коэффициент значим на 5% - ном уровне. Связь между показателями школьной готовности и итоговыми оценками первоклассников тесная и положительная.

Коэффициент ранговой корреляции Кендалла находится по формуле

(3)

где статистика Кендалла.

Для определения необходимо ранжировать объекты по одной переменной в порядке возрастания рангов (1,2,…,n) и определить соответствующие их ранги по другой переменной. Статистика равна общему числу инверсий (нарушений порядка, когда большее число стоит слева от меньшего) в ранговой последовательности (ранжировке) . При полном совпадении двух ранжировок имеем и при полной противоположности можно показать, что и Во всех остальных случаях

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28