В случае линейной парной регрессии
и уравнение регрессии значимо на уровне
если
![]()
Вычисление значимости коэффициента корреляции
. В практических исследованиях оценка
величина случайная.
Пусть вычисленное значение
. Возникает вопрос, объясняется ли это действительно существующей линейной корреляционной связью между переменными
и
в генеральной совокупности или является следствием случайного отбора переменных в выборку.
Обычно в этих случаях проверяется гипотеза
об отсутствии линейной корреляционной связи между переменными в генеральной совоку
пности, т. е. ![]()
Оценка существенности (значимости) линейного коэффициента корреляции основана на сопоставлении значения
с его средней квадратической ошибкой
:
.
Укажем особенности расчета этого критерия в зависимости от числа наблюдений (объема выборки)
.
1. Если число наблюдений достаточно велико
и есть основание полагать,
что выборка осуществлена из нормальной совокупности, то
рассчитывается по приближенной формуле
.
Обычно при большом
, выполнение условия
означает значимость
, а связь – реальной. Задавшись определенной вероятностью, можно определить доверительные границы
. Так, при вероятности
, для которой коэффициент доверия
(табл. 6 приложения: критические точки распределения Стъюдента), доверительные границы
составят
![]()
При вероятности
, для которой коэффициент доверия
, доверительные границы
составят ![]()
Поскольку значение
не может превышать единицу, то в случае, если
следует указать только нижний предел, т. е. утверждать, что реальный
не меньше чем ![]()
2. При небольшом числе наблюдений
средняя ошибка линейного коэффициента корреляции определяется как

а значимость
проверяется на основе
критерия Стьюдента. При этом выдвигается и проверяется нулевая гипотеза
о равенстве коэффициента корреляции нулю, т. е.
, т. е. отсутствии связи между
и
в генеральной совокупности. Для этого определяется расчетное значение критерия:

и сопоставляется с ![]()
Если нулевая гипотеза верна, т. е.
то распределение
критерия подчиняется закону Стьюдента с заданными параметрами
принимаемым обычно за 0,05, и числом степеней свободы
. Гипотеза
отвергается, т. е. выборочный коэффициент корреляции
значимо отличается от нуля, если
![]()

где
- табличное значение
критерия Стьюдента, определенное на уровне значимости
при числе степеней свободы
. Связь между
и
считается реальной.
Если
то нулевая гипотеза не отвергается и коэффициент корреляции считается незначимым, т. е. считается, что связь между
и
отсутствует, и значение
, отличное от нуля, получено случайно.
Пример 3. Проверить на уровне
значимость коэффициента корреляции между переменными
и
по данным табл.19 .
Решение. Ранее вычислен
. Статистика критерия

Для уровня значимости
и числа степеней свободы
находим критическое значение статистики
(табл.6 приложеня). Поскольку
, то считаем, что коэффициент корреляции между суточной выработкой продукции
и величиной основных производственных фондов
значимо отличается от нуля.
Для значимого коэффициента корреляции
целесообразно найти доверительный интервал (интервальную оценку), который с заданной надежностью
содержит (точнее, «накрывает») неизвестный генеральный коэффициент корреляции.
Для построения такого интервала необходимо знать выборочное распределение коэффициента корреляции
, которое при
несимметрично и очень медленно (с ростом
сходится к нормальному распределению. Поэтому прибегают к специально подобранным функциям от
, которые сходятся к хорошо изученным распределениям. Чаще всего для подбора функции применяют
преобразование Фишера:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |


