,
и т. д. (рассчитанные таким образом средние
представлены в последнем столбце корреляционной таблицы).
Итак, увеличение средних значений результативного признака с увеличением значений факторного признака еще раз свидетельствует о возможном наличии прямой корреляционной зависимости числа туристов, воспользовавшихся услугами фирмы, от затрат фирмы на рекламу.
Корреляционная таблица позволяет сжато, компактно изложить материал. Поэтому все последующие расчеты можно вести по корреляционной таблице.
Выборочный коэффициент корреляции Пирсона для группированной
корреляционной таблицы определяется формулой:
, (6.1)
где
(6.2)
– выборочная ковариация;
и
– центры соответствующих интервалов группировки;
,
,
,
(6.3)
– соответствующие выборочные дисперсии.
Для выборочной ковариации
справедлива формула
, (6.4)
являющаяся аналогом формулы
в теории вероятностей. Для простой (негруппированной) выборки формулы (6.2) – (6.4) упрощаются и приобретают вид:
, (6.5)
,
,
. (6.6)
Выборочный коэффициент корреляции
обладает всем свойствами, которыми обладает теоретико-вероятностный коэффициент корреляции
. В частности, для любой выборки
.
При этом, чем ближе
к 1 (или к
), тем сильнее выражена линейная зависимость между X и Y. Однако значимость такой зависимости должна быть
подкреплена проверкой гипотезы. Проверка гипотезы о наличии корреляции осуществляется следующим образом. Основная гипотеза – отсутствие линейной статистической связи (
); альтернативной гипотезой может выступать любая из трех возможных 
В тех случаях, когда справедливо предположение о нормальном распределении двумерного генерального вектора
, подходящей статистикой для проверки основной гипотезы является статистика Стъюдента
, (6.7)
где обозначено
– выборочный коэффициент корреляции, а объем n выборки предполагается большим (число степеней свободы равно
).
Пример 6.3. В таблице представлены результаты измерений роста Х (см) и веса Y (кг) 50 мужчин – слушателей военной академии:
Y Х |
|
|
|
|
|
| 2 | 5 | 4 | 1 | 12 |
| 2 | 8 | 9 | 4 | 23 |
| 0 | 4 | 6 | 5 | 15 |
| 4 | 17 | 19 | 10 | 50 |
Вычислить выборочный коэффициент корреляции и проверить гипотезу о значимости корреляционной связи.
По формулам группированной выборки вычисляем средние
,
,
выборочные вторые начальные моменты
,
,
.
Далее, используя формулы (6.2) – (6.4), получаем:
,
,
.
Наконец, по формуле (6.1) определяем:
.
Проверим значимость коэффициента корреляции при двусторонней альтернативе (
) и
. Из таблицы распределения Стъюдента находим квантиль
. Выборочное значение статистики Z равно:
.
Так как
, то
, поэтому гипотеза
отклоняется в пользу гипотезы
. Корреляция значима. ![]()
Замечание. Несколько обескураживающий результат предыдущего примера(
отвергнута при достаточно малом значении r) объясняется сильной зависимостью статистики Стъюдента от объема выборки n. В следующем параграфе при анализе регрессии будет показано, что линейная связь может оказаться значимой и при малых значениях коэффициента корреляции r. Однако для получения надежных выводов при использовании статистики Z следует иметь более 100 наблюдений.
Менее чувствительной к объему выборки является статистика U, основанная на преобразовании Фишера:
.
Фишером было доказано, что при
случайная величина V имеет приближенно нормальное распределение с независящей от r дисперсией
,
и математическим ожиданием
,
где
– истинное (но неизвестное) значение коэффициента корреляции двумерного генерального вектора
.
Стандартизуя V, получим подходящую статистику Фишера:
. (6.8)
Заметим, что с помощью указанной статистики можно проверять более общую гипотезу о сравнении с эталоном
против любой из трех альтернатив
. В этом случае
заменяется на условное математическое ожидание
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 |


